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PROBLÈMES DE L’ANALYSE SPECTRALE 
DES SÉRIES TEMPORELLES STATIONNAIRES 


par 


M. S. BARTLETT 


1. INTRODUCTION : QUELQUES REMARQUES 


L'analyse statistique des séries temporelles, et des pro- 
céssuüs stochastiques en général, ne diffère pas en principe de 
l'analyse des autres types de calcul statistique. Toutefois, il 
est bien connu que la déduction statistique doit dépendre en 
premier lieu des spécifications théoriques appropriées; aussi 
n'est-il pas surprenant que de récents développements dans la 
spécification théorique des processus stochastiques, et en par- 
ticulier des séries temporelles stationnaires, puissent avoir 
une répercussion considérable sur les méthodes de l'analyse sta- 
tistique. I1 est également bien apparent que, pour les processus 
stochastiques, ce n'est que ces dernières années qu'on a commen- 
cé à prêter une sérieuse attention aux rapports qui existent en- 
tre la théorie et la méthode. Il y a une publication fondamenta- 
le, bien que très abstraite, qui est de Grenander (1950). Le 
travail des mathématiciens anglais, avec la note de Yule qui à 
devancé les autres (1927) sur les séries temporelles, tend à 
être d'un caractère en quelque sorte plus utilitaire. Suivant la 
voie tracée par Yule, il y a eu une tendance à passer de l'ana- 
lyse classique du type de “périodogramme" associée au spectre 
des séries, à une analyse d'autocorrélation et d'auto-régression 
associée au "corrélogramme" des séries (voir, par exemple, M.G. 
Kendall, 1946; Bartlett, 1946). Cela est en accord raisonnable 
avec l'expérience: bien des séries temporelles appartiennent au 
type qui présente un spectre continu dans le sens du théorème de 
Wiener-Khintchine (à voir dans Levy, 1948) et du théorème analo- 
gue sur les séries discrètes énoncé par VWold; et, de plus, ces 
mêmes séries ont une représentation de base autorégressive (Wold 
1938) qui peut être finie avec quelques termes seulement, au 
moins en faisant une approximation. Pour ces modèles finis auto- 
régressifs, et (pour les valeurs discrètes du temps)de la forme: 


X, +a, Xp) Fesss..a, Xt4 = Ye 


des solutions asymptotiques aux problèmes d'estimation et de dla 
qualité d'ajustement existent pour les résidus normaux Yt (en 
supposant qu'on a un écart oo? constant et une moyenne nulle), 
ou, plus généralement , pour les résidus indépendants. Ainsi 
Mann et Wold (1943) ont donné une solution très satisfaisante du 
problème d'estimation, aussi bien pour les séries simples que 
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pour les séries multiples; et des tests de ‘'goodness of fit" ont 
été exposés par divers auteurs (Quenouille, 1947; Wold, 1949; 
Bartlett et Diananda, 1950 ; Whittle 1951, 1952, Walker, 1952; 
et pour les séries multiples, Bartlett et Rajalakshman, 1953; 
Whittle, 1953; voir pour une revue générale, Bartlett, 1954). 
Somme toute, la tendance à tout rapporter aux méthodes de corré- 
lation a été jusqu'à un certain point une réaction contre l'in- 
succès de la technique classique du périodogramme pour ces sé 
ries, et contre la découverte, faite parfois empiriquement, que 
tout essai direct d'estimation de la fonction spectrale engendre 
des fluctuations qui augmentent, au lieu de diminuer,avec a 
longueur de la série. Avant de dire le mot final sur les valeurs 
relatives des méthodes de corrélation ou de périodogramme, il 
est prudent de revoir cette dernière avec plus de soin. On peut 
natutellement remarquer que du théorème de Wiener-Khintchine 
l'analyse de corrélation et l'analyse harmonique sont maintenant 
bien connues comme un double aspect de la même analyse théorique 
(on peut montrer qu'il en est de même pour l'analyse arithméti-— 
que de la série qui se réalise) et qu'alors la méthode employée 
est en fait peu importante, supposant toujours une interpréta- 
tion juste. Il serait prématuré de chercher à porter dès main-— 
tenant un jugement définitif, mais il est peu probable que ce 
soit si simple; le problème de dégager les caractéristiques de 
données statistiques au moyen de quelques constantes, dans le 
cas de séries temporelles, se résout au mieux tantôt par les 
corrélations, tantôt par les périodogrammes. Ainsi, les cons- 
tantes d'un modèle fini autorégressif seront mieux déterminées 
par les corrélations; et les termes discrets harmoniques dans 
une série harmonique classique par le périodogramme. Je me pro- 
pose ici de discuter de certains problèmes restés en suspens, 
associés à des périodogrammes ou à des analyses spectrales et 
j'indiquerai des solutions qui sont plutôt possibles que finales 


2. PÉRIODOGRAMMES ET SPECTRES CONTINUS 


Pour une re temporelle réelle strictement stationnaire 
en temps discret(l Xt * le périodogramme classique est obtenu 
en calculant (soit pour l'intégrale p) la quantité: 


oo 2m ipr/n 
G,= A +18, VE D Xe 


(on calcule A,et B, séparément), et l'intensité I,= G G* = A+ B}? 
Le facteur V(2/n) a été introduit pour que la moyenne E L}soit 
égale à 207 pour une série à termes complètement indépendants. 
Nous supposons pour simplifier, que Ef{X;] = 0, bien que cela ne 
soit pas essentiel pour p + 0. Si maintenant nous définissons la 
fonction de covariance 


nes 


CT ns + Xp Xpps (530 : Gs=Cs) 


(1) L'analyse d'une série temporelle en temps continu est naturellement sem- 
blable en principe: pour une discussion plus serrée de ce sujet, voir Baven- 
port, Johnson and Middleton (1952) 
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un calcul assez simple nous montre que: 


St * (1- 2m 
Pr? se n) s æs(se),  (u, =17e) 


Le) 


C'est la relation entre Ih et le corrélogramme C;/Codont on a 
déjà parlé; c'est cependant la moyenne de cette relation, soit 


E {}=20o% ss (1- -Él) Ps cos( sc) 


qui correspond pour no à la relation de Wold entre Ps la 
fonction spectrale. Quand cette dernière est absolument rs 
avec, pour la densité f(w ), O<w <T , cette relation devient 


OO 
2 a 2 
2TOY F(w,)=20, D p; cos(su) 
S=-00 
Considérons maintenant les fluctuations de Le 


On sait que, pour une suite normale RENE ES Yt ces fluc- 
tuations sont représentées par la loi de probabilité: 


D (L>2)- exp (-1/12,) 


1 
et, en particulier, var(Ip) = 40* = [E {1 ]] . Même si Yen'est 
pas normale, nous avons encore 
2 ; 
20 (1-ein(ortor)) à 
Ji n i (@, t Co 


: Fo Fq 


1-e 
nn 27 p/nu, &,=27T q/n, le signe Ÿ correspond à HJ,H# ,et 


V (2/2) De 2 M , Celle-ci disparait avec pet q en- 
Le ce qui Wire que Hp n'est en corrélation ni avec Hg ni 
avec HX ; Ou ce qui revient au même, que les parties réelles et 
imaginaires de Hp et Ha ne sont pas en corrélation. E H}} est 
aussi nulle, donc les parties réelles et imaginaires de Hp ne 
sont pas en corrélation et apportent le même carré moyen dans 
E{H, H#}°. 

De plus, pour les quantités du 2° ordre Jp = Hp H$ on trou- 
ve immédiatement que E {Jp Ja) _ 4 y 


PAS + Sgÿ [ Lécsnrenten NT 
= #{ = 


1-cos (a +) 1- COS (G4-G2) 


où Kj =E {yé) - 30% 


Ceci conduit aux conclusions suivantes: 


(i) var { Jp) U 4 oY ce résultat étant toujours vrai si Y 
n'est pas normale 


(ii) covar {JP Ja} ; pour n |w,-w,|[51, est: 
a) O(1/n°)pour Y: normale (exactement zéro si p, q sont entiers) 
b) O(1/n) si Kk, #4 0 . 
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Supposons maintenant que X} soit ce que j'ai appelé (Bart- 
lett 1946) un processus linéaire 


Lee] 
XE ee Va (b;=0 pour u 0), 


Cette représentation et la représentation autorégressive pour Yt 
orthogonale (sans corrélation sont équivalentes, mais l'hypo- 
thèse supplémentaire c'est que Y, est une suite normale ou au 
moins indépendante. Alors 


Hs se 


n UvU=-œ r=1 


et AV AE, (w= 27 p/n) 


où P)= Dh, evo 


On suppose que b, — 0, exponentiellement, lorsque u CrOLb, REA 
différence entre Gp et B*(w) Hp n'étant dûe qu'à "l'effet de 
l'extrémité" (end effect). En fait on montre que ceci affecte la 
distribution de Gp (ou Ib) jusqu'à seulement O(1/n) (cf. Sargan 
1953), mais le résultat plus faible pour le résidu découle plus 
directement, et il est suffisant pour notre étude, 
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Le résultat asymptotique 
G, v B* (w) H, 


a une importance considérable. Il nous donne tout de suite la 
relation asymptotique 


* er 
1, & Bu) B(wT J, (B(w)) supposé non nul) 
Si nous prenons la moyenne de cette relation, nous avons pour 
n—o, le résultat théorique 


2no% F(w) = 2 P(«) B"(c) 


mais ici l'on a besoin de la relation sous la forme stochastique 
Cela nous donne la relation asymptotique entre le périodogramme 
d'un processus linéaire et le périodogramme d'une suite indépen-— 
dante avec un spectre uniforme et nous montre que la distribu- 
tion de Ip est encore asymptotiquement valable (au moins pour YE 
normale) condition de remplacer 2 o? par Am, E {Ip .Ce 
résultat a été indiqué d'abord par Slutsky (1927) (bien que pas 
très clairement), 


I1 est évident d'après les résultats énoncés ci-dessus, que 
Ip ne saurait fournir une estimation pour 2T©% f(w) bien que 
Cs/Co soit une estimation deps. On a été amené ainsi à suggérer 
certaines modifications pour avoir des estimations'consistantes" 
(cf. Bartlett, 1950; cf. Tukey, 1949), par exemple, 


(i) l'(D) = han (ares (P,.J, Daniell) 
(ii) 1 (w)= 2 5. ne C4 cos (sw) (Bartlett) 


où n = n'm. Cette dernière formule présente la propriété utile 
de permettre le calcul à partir des n' - 1 premières autocorré- 
lations de la série réalisée et ne nécessite pas une évaluation 
complète de I 


Grenander (1951) a ensuite considéré la formule plus générale, 
avec une fonction pondérale arbitraire a(«), 


(ii) '@) = f1 LA PO CE 


qui comprend (i) et (ii) comme cas particuliers. On ne peut 
faire un bilan final de l'efficacité pratique des différentes 
méthodes, 

(Un étudiant de Manchester,J. Medhi, dans un travail en cours, a 
entrepris la recherche de la fonction optimum œ (w) de I" () 
dans des conditions déterminées) 


3. BANDE ASYMPTOTIQUE DE CONFIANCE DE LA FONCTION 
SPECTRALE 


Grenander a aussi attaqué cette intéressante question: la 
construction de la bande asymptotique de confiance de la fonc- 


124 S. BARTLETT 


tion spectrale entière, et, (en collaboration avec Rosenblatt, 
1952,1953), il a proposé une solution dans certaines conditions. 
J'ai l'impression qu'on peut avoir des solutions plus satisfai-— 
santes si l'on accorde une considération adéquate aux résultats 
précédents sur les réalisations et je me propose donc d'étudier 
ce problème 


La transformation linéaire de X en A BLpour p=l,...p(n-1), 


et A, pour n impair; où p=l,..p(n-2), et A, Ajpns Pour n pair, 


est orthogonale (en admettant que le facteur 2? dans Vi/n est 
supprimé pour p=0 ou 1/2 n). Nous remarquons que de plus: 


n 
2 2 2 
de À re 0 AA D BE) 
Yon 
j! 


(a Le (G (u-1)au lieu den si n est impair 
p=° 


maintenant pour une suite normale indépendante Xr, il s'ensuit 
que la somme cumulative 


q 
= I 
pe P 


‘q 


représente une promenade au hasard, Si nous imposons la condi- 
tion que: 
n Y2n 


1e x, ta D 1, Sn 


Fr=1 


soit donné, il ressort de la théorie des distributions lapla- 
ciennes que la distribution de S est équivalente à celle de 


Le Sa/Syan (indépendamment de Sinn) 


Ta variant de O à 1 lorsque q varie de O à + n. Les Tarepré- 
sentent une promenade au hasard conditionnelle qui peut être 
testée contre son espérance mathématique 2q/n selon la théorie 
de distribution des fonctions de répartition énoncée d'abord par 
Kolmogoroff (pour son interprétation selon la théorie de marche 
au hasard, voir par exemple Bartlett, 1949), Ainsi l'écart de 
Ta à 2q/n n'excède jamais +1///2n) avec la probabilité 


œ 227 
de C1) LABX S 


S=—00 


Ce test est asymptotiquement valable pour Xr indépendante et 
normale. Mais là-dessus nous avons édifié un critère qui est un 
rapport et donc une fonction des autocorrélations réalisées 
Rs = Cs/Co; il ne sera pas donc sensible à la non normalité (cf. 
Bartlett, 1946); en particulier la variance asymptotique de Tq 
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sera indépendante de K;, le cumulant du quatrième ordre de Xr En 
fait on peut vérifier par nos résultats précédents sur les réa- 


1 t 
isations que . {T} v 4q(1-2q/n)/n? 


indépendamment de K4 , et en conformité avec une marche au hasard 
restreinte à 
Tipon =! 
Pour adapter ce test au processus linéaire X-, nous remarquons 
que : 
q 


“ l on WB*w]= > 9 (140 (1/n)) (= 2 


P=o P=o 


(l'ordre de grandeur du résidu reste le même que précédemment 
puisque Jp > O0 et que son espérance mathématique est la même pour 
des valeurs différentes de w ). Par suite, finalement, comme 
B(w ) fP'(w) est PERDRE SRE à f (w), nous pouvons prendre 


an 
OO  & 

Cette fonction est immédiatement utilisable pour tester la qua- 
lité de l'ajustement d'une fonction spectrale quelconque donnée 
a priori. Elle est en principe également utilisable pour cons- 
truire une bande de confiance pour un spectre inconnu; mais 
puisque cette fonction dépend de f(w ) d'une façon compliquée au 
point de vue du calcul arithmétique, elle est au moins commode 
pour cette construction. Pour éviter la pondération de chaque In 
on peut réciproquement considérer la fonction non pondérée 


q An 
Lis 2 lp | > 1 


Malheureusement les propriétés de la répartition de Ug ne sont 
pas simples, car Ug n'est plus (même pour les processus lapla- 
ciens) équivalente à une quantité associée à une promenade au 
hasard (à moins que son dénominateur soit considéré comme fixe). 
Sa structure suppose, cependant, que sa distribution est insen- 
sible à la non-normalité; sa tac tance asymptotique, en particu- 
lier, est obtenue comme 


1/2 n 


q 
2m] (1-7 ))f jh FF o)+ Fu) LE Fe) | 
p=o p= +1 
où nous avons écrit 
q : 14N 
S_f@)/ D Ft) Flu) 
p=o p=0 


Si, ensuite,nous réduisons Uq en divisant son écart de F (eq ) 


par Va Fe 
PTE s eo] aV/[er/ ru TOI 
p=0 
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nous suggérons que la quantité [ Ua - F (@a)]/F, pourrait 
(comme approximation temporaire) en attendant de nouvelles re- 
cherches sur sa répartition(1) être testée de la même manière 


que Tq- 2q4/n 


Un tel critère alternatif pour TJ ne dépend toujours que de 
la fonction spectrale f(w ), mais il est peut être commode d'in- 
troduire une estimation consistante fonction de l'échantillon,et 
cela ne changera pas le test de Ualorsque n est grand. Une 
telle estimation est, par exemple, obtenue par (1) 


2n 2 \2n f) 
Dh, I @)/ [ IE I ()] 
p=o = 


2 
à condition de se rappeler que la valeur moyenne de I (&}) est 
asymptotiquement le double du carré de E {I (w)} , de sorte que 
la quantité ci-dessus a la valeur asymptotique 


à 2 
n 2 n 
{16 (wo) AE 


= 4 v/n 
La fonction proposée et étudiée par Grenander et Rosenblatt est 


mn nm © 
V ss. lioldoas— Lier 
4 À n & 


mais elle me paraît avoir le désavantage, sa dépendance de K 
mise à part, d'être une estimation de la “fonction spectrale" 
der) correspondant à l'autocovariance fps ; alors qu'elle 
est généralement moins intéressante que la fonction spectrale 
définie ici, F (wa), correspondant directement au corrélogramme 
ps + Théoriquement, Tq semble supérieur à Uq ou à Vq *. Une dé- 
monstration rigoureuse des propriétés asymptotiques de Vq a été 
donnée par Grenander et Rosenblatt ; une démonstration analo- 
gue doit être bien plus simple pour Tq » 


I1 peut parfois être plus utile d'avoir des tests qui n'utili— 
sent pas les “sommes cumulatives'", mais utilisent toujours les 
propriétés asymptotiques de Ip. Un désavantage des tests précé- 
dents semble être que si Ip s'échelonne sur un spectre uniforme 
comme dans T, alors © a le même poids dans tout son domaine de 
variation; bien que (pour employer la terminologie de la physi— 
que) "l'énergie" du spectre peut être largement concentrée dans 
un domaine particulier. D'autre part, si Th ne s'échelonne pas, 


(1) La vraie variance asymptotique de Uq peut, pour toute fonction particu— 
lière f(w) être comparée, s'il en est besoin, avec la variance entraînée par 
l'approximation (une telle comparaison pour l'exemple numérique du $ 5 a mon- 
tré que l'approximation était dans ce cas tout à fait acceptable). La validi- 
té de l'emploi de Uq au lieu de TJ peut, cependant, être beaucoup accrue en 
modifiant f (w) pour la rapprocher de l'uniformité au moyen d'un changement 
d'échelle en divisant par une densité provisoire f, (w ). Ce procédé donne une 
statistique effectivement équivalente à Ta ,; mais pour laquelle une bande de 
confiance peut être immédiatement obtenue, 


Cette estimation ne serait pas très juste, si la densité du spectre présen- 


tait une pointe importante pour quelque & car son erreur d'échantillonnage 
serait alors grande sauf pour n très grand, 
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comme c'est le cas avec U et Vi ; la moyenne supérieure de Ip 
dans les domaines plus importants dew tendra à réduire la vi- 
tesse d'approche vers ces propriétés asymptotiques. 


On a les deux alternatives: 


i) Tester le plus grand Ip après avoir pondéré à l'uniformité au 
moyen d'un f (w) hypothétique; cependant, ce test là semblera 
être plus sensible à un élément spectral anormal discret, et na- 
turellement il est employé dans le cas "classique" de f (w) déjà 
uniforme (Fisher, 1929; cf. voir aussi le $ 4 de cette note), 


ii) Tester l'homogénéité de Ip au moyen d'un X? pour l'homogé- 
néité des variances (Bartlett, 1937; voir aussi Bartlett, 1950, 
Whittle 1952 a, dans le présent contexte). Si les Ib sont emplo- 
yés dans sommation, chacun d'eux est asymptotiquement équivalent 
à une estimation de variance avec deux degrés de liberté. Après 
la pondération, ces estimations doivent être homogènes. Ce test 
est très souple, car avant de faire le test on peut faire un 
groupement de Th pour un domaine dewpeu important, afin de le 
rendre plus sensible et tout aussi valable pour le domaine plus 
important de . Une conséquence intéressante des propriétés 
d'échantillonnage de Ip déjà indiquées c'est que ce test doit 
Fire Fer à l'absence de normalité dans le présent contex- 
te (1): 


4. SPECTRES MIXTES 


Jusqu'à présent nous avons considéré des séries temporelles 
ayant des spectres continus, — en contraste avec des séries har- 
moniques classiques avec quelques fréquences discrètes, à part 
peut-être un élément "d'erreur" au spectre uniforme, Dans de 
nombreuses applications il est raisonnable de supposer que l'on 
sait a_ priori à laquelle de ces deux classes principales appar- 
tient la fonction spectrale. Il faut remarquer que tout élément 
harmonique discret à fréquences connues peut être éliminé par la 
méthode classique des moindres carrés; une variation annuelle ou 
saisonnière tomberait dans cette catégorie. La présence de tout 
spectre continu complique l'erreur d'estimation d'amplitude et 
de phase, mais pas plus que cela ne se produit dans l'estimation 
d'une moyenne générale non nulle. 


En somme, il reste encore à discuter deux problèmes qui ne 
se présentent heureusement pas très souvent. Dans le premier 
nous pouvons avoir, ou bien un spectre discret à "bruit" unifor- 
me ou bien un spectre continu; dans le second nous pouvons avoir 
les deux simultanément. Pour le premier la difficulté réside en 
ce que pour une longueur finie de séries, l'intensité du pério- 
dogramme près de la fréquence d'un élément discret peut être 
confondu avec le maximum d'un élément spectral continu et vice- 
versa. C'est un problème de discrimination où, si nous connais 
sons la distribution des résidus, le critère convenable est le 


(1) On suppose remplie la condition que le nombre de degrés de liberté de x2 
est restreint, disons, à un nombre fixé n, en groupant les Ip . (L'emploi du 
nombre maximum + n a été en effet considéré par Wittle, 1952 a; mais, même 
dans le cas normal, sa discussion m'apparaît avoir besoin de développements 
suppiémentaires). 
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quotient de vraisemblance p,/p,3; où p, et p, sont les vraisem- 
blances des deux hypothèses respectives. La difficulté réside en 
ce que ni l'une ni l'autre hypothèse alternative n'est exacte- 
ment connue, mais renferme plusieurs constantes non déterminées. 
On peut toutefois tenir compte approximativement de l'effet pro- 
duit par l'utilisation des estimations de ces constantes, Ainsi 
si nous voulons comparer les deux hypothèses Hs, H, le processus 
normal consiste à voir dans: 


Ho: un élément spectral uniforme continu avec un seul élément 
harmonique discret surajouté 


H,: une série autorégressive du second ordre, nous avons alors: 


1 
(log Pa Etain CD : 


où Den la somme des carrés des résidus après avoir ajusté 
l'élément discret harmonique (on suppose que la variance rési- 
duelle æ? est inconnue). De même 


1 
(log ES Foot og). 3 


où D est la somme des carrés des résidus après avoir ajusté la. 
relation autorégressive. Comme >_,perd deux degrés de liberté 
quand on ajuste un élément discret de fréquence connue(l'erreur 
supplémentaire provenant de l'estimation de fréquence peut être 
négligée) et, qu'il en est de même pour Ve >; nous pouvons pro- 
visoirement admettre l'effet d'estimation en écrivant 


og mteg p, = (n-2) lg (X / ©) 


(on suppose que , à l'origine ,; le nombre d'observations dans la 
fonction de vraisemblance est n dans chaque cas; souvent, par 
commodité, les premières K observations ne sont pas employées 
dans l'ajustement d'une série autorégressive d'ordre K; alors 
il est utile de faire un ajustement de plus pour rendre p, et p, 
aussi comparables que possible), , 


La manière la plus simple de tester le quotient précédent 
consiste à employer l'adaptation suggérée par G.A. Barnard de la 
théorie de Abraham Wald de tests séquentiels. Nous regardons 
notre échantillon de n observations comme le premier d'une 
suite hypothétique d'échantillons indépendants et adoptons la 
règle suivante; 


APT ST Por > (1-e)/e on adoptera H6 
D} ISSIMNTP, Pr << CAS) on adoptera H, 
chhsi NUE b,,/Poe/ (le) on ne décidera rien sans de 


nouvelles données, 


Ainsi le risque d'erreur d'accepter H ÿ Hy est'0 vraïigon 
vice-versa, n'est au moins pas supérieur à e (1 


(1) Cette règle obligera à de trop prudentes évaluations des risques si(comme 
nous l'espérons) la probabilité d'une décision avec un seul échantillon dis- 
ponible n'est pas petite. Quelques exemples explicites ont été étudiés par 
J. Medhi, 
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Le dernier problème que nous avons cité, et où l'on a à la 
fois le spectre discret et le spectre continu est la question la 
plus difficile à résoudre. Wittle (1952) suggère comme méthode 
possible une standardisation approximative du périodogramme d'é- 
‘ie I, par f (w) (comme dans notre fonction précédente 
:3 

aq e 


Nous avons vu que ceci réduit asymptotiquement le périodo- 
gramme d'une série à spectre continu à un périodogramme d'une 
série à spectre uniforme, de sorte qu'on peut employer la métho- 
de "classique" de détection des éléments discrets sur des bruits 
uniformes du fond. La difficulté réside naturellement dans ce 
fait que nous ne connaissons pas f (« ); mais Whittle suggère 
qu'elle peut être estimée par les procédés de régularisation que 
nous avons déjà étudiés dans ces conférences. Comme cette esti-— 
mation peut être influencée à son tour par des éléments discrets 
non encore éliminés, une ou plusieurs itérations de ce procédé 
peuvent être nécessaires. Même alors, il n'est pas très clair 
jusqu'à quel point cette itération converge pour des séries fi- 
nies. Comme je l'ai déja souligné, de nouvelles recherches sur 
tous ces problèmes que nous venons de discuter sont encore né- 
cessaires avant qu'on puisse enfin imposer leur valeur pratique. 


5. APPLICATIONS NUMÉRIQUES 


Nous allons appliquer quelques uns des tests des paragra- 
phes 3 et 4 à des records de chasse au lynx canadien (cf. Moran 
1937); ces records montrent un "cycle" intéressant de 10 années. 
Les chiffres sont de 114 fréquences annuelles, qu'on exprimera 
pour des raisons de commodité en logarithmes, À partir de ces 
données, on calcule les valeurs Ip (voir le tableau I dans l'ap- 
ondice). À cause de la valeur très forte de p = 12, on ne peut 
déduire immédiatement s'il n'y a pas lieu d'introduire un élé- 
ment spectral discret. Cependant, si nous comparons les somnes 
des carrés des résidus dans les deux hypothèses H et H, du pa- 
ragraphe 4, nous avons: 


“+ = 35,236 — 21,025 = 14,211 (111 degrés de liberté) 
o 


» = 5,788 x 11109 = 5,894 () 1/2 (ui) loge 14,21/5,894) —489> loge? =4,60 
; 


Aussi, entre H, et H,, c'est H, qu'il faut choisir.( Moran est 
arrivé à la même conclusion, sans cependant avoir établi un test 
définitif, par la seule inspection du corrélogramme). Les coef- 
ficients à, et a, de l'équation auto-régressive 

Li EN Ur Qu 2e op” 
ou X est mesuré à partir de sa moyenne d'échantillon, sont 
2,401 et 0,773 


De la formule 


F)=fot /no 2 18 ()B*te) 


(1) Le chiffre 5,788 est obtenu à partir des 112 résidus actuels donnés par 
Moran après avoir ajusté un modèle autorégressif du 2° ordre; il a été ajusté 
pour compenser les 2 premiers résidus manquants, 
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où 
17 LB (co) B*(w)]=(1-a,}? + a! +1a, (1+a,) cos +4 cos?u = b() 


nous pouvons construire facilement Tq » dans l'hypothèse H,. 
q V2n 
LCR b(co) / . 10) (w—2n p/n) 


I, n'intervient pas, car elle correspond à la moyenne (ici non 
nulle}, La différence absolue la plus grande de Tq par rapport à 
q/57 est 0,184 CpouT q= 30) qui dépasse juste le niveau signifi- 
catif de P= 0,05 , de 1,36/Y57 = 0,180. 


Dans cet exemple l'effet dominant de la fréquence au voisi- 
nage de p = 12 est, ainsi qu'on l'a noté au $ 3 perdu dans le 
test Tq » et l'emploi du test Ua non pondéré pourrait. paraître 
plus approprié. Pour ce test alternatif, comme on cherche à tes- 
ter une f(w ) particulière plutôt qu'à trouver une bande généra- 
le de confiance, il est préférable de calculer 


2 Ven 2 \2 Van 
(2n) 2 PRO 
ve on oi eo-1[2+) >, t/b'() 
p=0o p=0 
à partir des valeurs théoriques de b (w ), particulièrement en 
vue d'obtenir la valeur d'échantillon maximum de Ip pour p = 12. 


Avec o% /ok= 0,147783 (et la sommation comprend la moitié 
de la contribution de p= O et de p=} n, comme pour f(w ) J)nous 
obtenons v = 4,430. Alternativement, on peut employer la formule 


équivalente 
T co 
2 2 
DE rt utREs 
von/ Fldo—) p, 


= 
qui donne la vérification suffisante, 4,417, 


Une différence significative P=0,05 de Uq (disposée dans le ta- 
bleau I)à F (w )devra être de l'ordre de 1,36 x /4,43//57 = 0,38 
et malgré le grand saut de Ua pour p=12, cette valeur n'est pas 
atteinte. Bien plus, la contribution dominante de I souligne 
combien toute théorie asymptotique est inadéquate pour Ua (ou Va ) 
dans cet exemple(2), 


(1) Voir figure. 


(2) En utilisant alternativement la Statistique modifiée suggérée à la note 
de la page , avec la fonction f (w) utilisée dans Tq donnant la fonction 
spectrale provisoire, nous calculons: 

2 


L'(n9Z{r/1@) / [E 1p /£ (op) — 170904 


de telle sorte que maintenant Vv = 1,015. Comme on peut s'y attendre, cette 
valeur est voisine de l'unité, et montre qu'une bande de confiance approchée 
pour la vraie fonction f(w) peut être obtenue en remplaçant les frontières 
parallèles a' de la distribution théorique cumulative 2 qg/n du graphique Ta 
par de nouvelles frontières déduites par des translations de la M Tr 
cumulative observée Tq sur cette échelle provisoire. 
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Alors qu'on a eu une différence significative avec le test 
Tq, une comparaison de ces conclusions avec celles tirées des 
autres tests sur les corrélogrammes montre les limites des tests 
ci-dessus quand on les emploie conjointement avec une fonction 
f (w) "pas très uniforme", (cf. mes remarques à la fin du $ 3). 
Moran trouve que les coefficients de régression partielle du 
quatrième ordre et du cinquième ordre dépassent le niveau signi-— 
ficatif P-0,05. Un calcul plus compréhensif des 27 premières 
autocorrélations d'échantillons (qui ont été données par Moran 
dans cette he sur la base du test goodness of fit de 
Quenouille (1947), donne por X? total la forte valeur de 54,4 
avec 25 degrés de liberté (1), Cette approximation par le corré- 
logramme semble la plus naturelle quand une hypothèse de struc- 
ture autorégressive est sous examen. Néanmoins, quoique les 
tests des spectres, ne soient pas aussi appropriés dans cet exem— 
ple, l'emploi du X du périodogramme apparaît comme suffisamment 
effectif. 


Les nombres testés sont dans le tableau II; le groupement 
de quelques degrés de liberté a été décidé a_ priori par rapport 
aux contributions à la fonction de distribution théorique F (w ) 
et non par rapport aux valeurs Le 


Tableau Il 


Le 0.14013 4 12 0.41208 2 

3,4 0.40526 4 13 0.01589 2 

5 5,0 0.059068 4 14 0.00179 2 
ü 0.02310 2 15,16 0.02989 4 

8 0.07789 2 WAALO HO 0.04600 6 

9 0.01371 2 20,28 1.15438 18 

10 0.05135 2 29,57 4,87392 57 

iii 0.01707 2 113 


Le test d'homogénéité de ces sommes (pondérées) Ip donne 
COURT 70 où ets 11246 


c'est-à-dire un X corrigé de 33,52 (avec 14 degrés de liberté ) 
significatif au niveau P = 0,01. Ce résultat nous montre à par- 
tir du périodogramme avec une évidence plus convaincante combien 
l'hypothèse autorégressive est inadéquate. 


On doit remarquer que, tandis que la valeur pondérée de Ip 
pour p = 12 n'apparaît plus particulièrement anormale , il indi- 
que sur l'échelle originale une hauteur suffisante et un maxi- 


(1) 11 y a une certaine évidence théorique (Bartlett et Rajalakshmann, 1953) 
que ce test exagère le niveau significatif véritable pour n borné. Cepen- 
dant un calcul du prochain terme dans l'expansion asymptotique pour la va— 
riance d'échantillon, dans notre hypothèse que celui-là est comparable au 
terme correspondant du X? basé sur les corrélations directes des résidus 
(Bartlett et Diananda, 1950) donne un "X? réduit" de 38,5 avec 18 degrés de 
liberté, encore significatif pour le niveau P = 0,01. 
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mum assez proche pour rendre indésirable une régularisation ex-— 
cessive du périodogramme (avec seulement 114 observations); au- 
cune régularisation, d'après les méthodes- du $ 2 n'a été effec- 
tuée. Il serait évidemment possible de chercher à trouver des 
fonctions de densité spectrale f (w ) plus compatibles avec les 
Ip observées que celle que l'on a testée: mais mon premier but 
a été d'avancer et de donner des exemples de divers tests,plutôt 
que de faire un examen approfondi de ces données particulières. 


Remerciements — A M. A.M. Walker pour ses critiques au sujet de 
ces Conférences. A Mrs. A.Linnert pour l'analyse du périodo- 
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Le 
- 
A 


Ip 


0,3818 
0,7061 
2,2847 
1,2825 
0,4003 
0,2928 
0,3756 
1,6715 
0,4069 


© © —J O OI & © D + O 


T0: 1132 
MO 0120 
12 21,0246 
15 005776 
14  O0,0406 
15  O0,1812 
16 0,1557 
17 0,0924 
18  0,0080 
19  0,0927 


20070221 
21 0,2510 
2217023641 
DS ON LTTIT 
2110 017 
25  0,0339 
26  0,0325 
27  O0,1054 
28 0,0252 
29 0,00013 


30 0,02294 
31  0,05902 
32  0,04530 
33 O0,16174 
34 0,13346 
35  0,02145 
36 O0,01871 
37  0,06197 
38 0,00266 
39 0,02603 


40 0,02213 
A1  0,04949 
42 0,01225 
43  0,04148 
44 0,04151 
45  0,02565 
46  0,01052 
47  0,04077 
4{  0,0066€ 
49  0,00369 


50 0,01218 
51  0,01648 
52  0,03090 
53  0,00150 
54 0,01879 
55  0,01051 
56  0,00325 
57  0,00013 


TOTAL:35,230 


Uq 


0 
0,0108 
0,0309 
0,0957 
0,1321 
0,1435 
0,1518 
0,1625 
0,2099 
0,2215 


0,2814 
0,3074 
0,9041 
0,9205 
0,9217 
0,9268 
0,9312 
0,9339 
0,9341 
0,9367 


0,9374 
0,9445 
0,9547 
0,9598 
0,9688 
0,9698 
0,9707 
0,9727 
0,9744 
0,97438 


0,97503 
0,97671 
0,97800 
0,95259 
0,98637 
0,98698 
0,98751 
0,98927 
0,98935 
0,99009 


0,99072 
0,99212 
0,99247 
0,99365 
0,99482 
0,99555 
0,99585 
0,99701 
0,99720 
0,99730 


0,99765 
0,99812 
0,99899 
0,99904 
0,99957 
0,99987 
0,99996 
1,0000 
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Tableau | 
Ipb(w ) Ta 
(0) 0 
0,05116 0,0070 
0,08897 0,0192 
0,27188 0,0563 
0,13338 0,0745 
0,03659 0,0795 
0,02249 0,0826 
0,02310 0,0858 
0,07789 0,0964 
0,01371 0,0983 
0,05135 0,1053 
0,01707 0,1076 
0,41208 0,1639 
0,01589 0,1661 
0,00179 0,1664 
0,01292 0,1681 
0,01697 0,1704 
0,01515 0,1725 
0,00183 0,1728 
0,02902 0,1767 
0, 00906 0,1760 
0,13276 0,1961 
0,24049 0,2290 
0,14589 0,2489 
0,31814 0,2924 
0,04051 0,2979 
0,04596 0,3042 
0,17359 0,3279 
0,04796 0,3345 
0,00022 0,3345 
0,05672 0,3422 
0,16426 0,3647 
0,14111 0,3840 
0,55819 0,4608 
0,50877 0,5296 
0,0897û 0,5420 
0,08510 0,5536 
0,30578 0,5954 
0,01435 0,5974 
0,14823 0,6176 
0,13450 0,6360 
0,32031 0,6798 
0,08421 0,6913 
0,29938 0,7322 
0,31418 0,7751 
0,20336 0,8029 
0,08651 0,8147 
0,34866 0,8624 
0,05917 0,8705 
0,03664 0,8751 
0,11581 0,8906 
0,15737 0,9121 
0,30026 0,9531 
0,01480 0,9552 
0,18764 0,9808 
0,10571 0,9952 
0,03338 0,9998 
0,00152 1,0000 
7,32154 


F (w) 


0,00981 
0,02943 
0,04999 
0,07175 
0,09666 
0,12499 
0,15872 
0,20083 
0,25641 
0,33327 


0,43985 
0,57836 
0,71050 
0,80468 
0,86328 
0,89960 
0,92336 
0,93916 
0,95047 
0,95874 


0,96506 
0,96996 
0,97385 
0,97700 
0,97959 
0,98175 
0,98358 
0,96516 
0,96652 
0,987703 


0,988749 
0,969679 
0,990510 
0,991261 
0,991940 
0,992559 
0,993129 
0,993654 
0,994141 
0,994595 


0,995019 
0,995421 
0,995799 
0,996159 
0,996501 
0,996827 
0,997141 
0,997444 
0,997736 
0,998021 


0,998298 
0,998570 
0,998837 
0,999099 
0,999358 
0,999614 
0,999870 
1,000000 


AF (w) 


0,00981 
0,01962 
0,02056 
0,02176 
0,02491 
0,02833 
0,03373 
0,04211 
0,05558 
0,07686 


0,10658 
0,13851 
0,13214 
0,09418 
0,05860 
0,03632 
0,02376 
0,01580 
0,01131 
0,00827 


0,00632 
0,00490 
0,00389 
0,00315 
0,00259 
0,00216 
0,00183 
0,00158 
0,00136 
0,001187 


0,001046 
0,000930 
0,000831 
0,000751 
0,000679 
0,000619 
0,000570 
0,000525 
0,000487 
0,000454 


0,000424 
0,000402 
0,000378 
0,000360 
0,000342 
0,000326 
0,000314 
0,000303 
0,000292 
0,000285 


0,000277 
0,000272 
0,000267 
0,000262 
0,000259 
0,000256 
0,000256 
0,000130 


1,000000 


SUR UNE ESTIMATION EXHAUSTIVE 
POUR LA MOYENNE D’UNE VARIABLE ALÉATOIRE 
OBEISSANT A LA LOI DE LAPLACE 
DANS UN ESPACE DE BANACH 


par 


Shafik DOSS 


Introduction. Soit x une variable aléatoire prenant ses 
valeurs dans un espace de Banach B. On dira II (1) que x obéit 
à une loi laplacienne si, quelle que soit la fonctionnelle liné- 
aire f , définie dans B , la variable aléatoire numérique 
f (x) = x; obéit à la loi de Laplace. 

Observons que si l'on se donne la distribution de x pour 
toutes les fonctionnelles f , on a aussi, quel que soit n, la 
distribution de la variable (x, x,, ..., xs)eR" [V]. En effet, 
considérons la fonctionnelle t,f,+ t,f,+...+ tif, où les t; sont 
des nombres réels. On a 


Lt lier tir de ti X4, +hx+..+tthxe 
La valeur moyenne 


M Lebnyiinnts M (ets) 


est connue, par hypothèse, quels que soient les L,; mais ce 
n'est autre que la fonction caractéristique de la variable car— 
tésienne (x, xs, ..., x). D'après un théorème classique (par 
trip, 102) ,0la distribution de »la -yariable |(x, ..., x 

est déterminée. 


Remarquons encore que la fonction caractéristique d'une va- 
riable numérique laplacienne y étant gt") 4 M(y-MONŸ 
, 

on aura 


1) M (erËts Xfs ) => e'rmsts ZE drstrts 
où l'on a posé ms = M (x) ; Xrs = M (xs, — m.) ( Xf, — Ms Ar 


Ici À existe pour tout couple (r,s) en vertu de l'inégalité de 
Schwarz puisque, x étant laplacienne,i;i existe pour tout i . 


(1) Les nombres entre crochets renvoient à la Bibliographie à la fin du 
mémoire, 
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La formule (1) montre que la variable aléatoire 
(xs; fs ++. X,) obéit à la loi de Laplace définie par les mo— 
ments du premier ordre m, et les moments'du second ordre À.: .0n 
peut donc dire que la variable aléatoire xe B est laplacienne 


si uels que soient n et les fonctionnelles f, ; f2 » ++efn » 1a 
variable cartésienne (ET Xf,9 ee) >) est laplacienne. 

Soient a, , b; des nombres réels satisfaisant à -co< ai < bi<+oo 
L'ensemble des valeurs x satisfaisant à 


Aie XF CRD; 3 112), eves N 


sera appelé un intervalle I. 


Nos définitions impliquent qu'une mesure est donnée sur un 
corps borélien 1 de sous-ensembiles de B et que l'on a Iel 
pour tout intervalle I. Soit K le plus petit corps borélien 
contenant tous les I. On aura évidemment K<1l . Nous considè- 
rerons dans la suite exclusivement les ensembles de K. Il est 
bien connu [VI] que la mesure, définie pour tous les I, est dé- 
terminée de façon univoque peur tous les ensembles de K. Deux 


lois de probabilité qui coïncident sur les ensembles de K se— 


ront considérées comme identiques. 


La donnée d'une loi laplacienne pour x est équivalente à 
la donnée des lois laplaciennes correspondantes pour les 
xs et celles-ci sont équivalentes à la donnée des m,= M (x; )et 
Ag = M(xs- m;) (x - me 


Considérons la famille des lois laplaciennes pour lesquel- 
les les À4 sont fixés et les m, sont variables, La donnée des 
ms est équivalente à la donnée de la moyenne M(x), quand elle 
existe, de la variable aléatoire x. Cette moyenne étant définie 
[IV] par l'égalité 


f (M(x)) = ms pour toutes les fonctionnelles f. 


Considérant n déterminations indépendantes x‘',x°, ....,xt") 
d'une variable aléatoire x obéissant à une loi de la famille 
considérée, et formant l'élément n =(x!" +,.,..+ x()/n, il est 
naturel, généralisant un résultat connu (voir par ex. [I] p.495, 
EX. 21 de présumer que constitue une estimation exhaustive 
du paramètre M(x) qui détermine la loi considérée, C'est ce que 
nous allons établir. Mais rappelons d'abord la définition donnée 
par Halmos et Savage (III) des estimations exhaustives, 


Définition de Halmos et Savage. Soient X et Y deux ensembles 
abstraits et soient S et % deux corps boréliens de sous-en— 
sembles de X et Y respectivement. On dira que la fonction T 
définie sur X et prenant ses valeurs dans Y est mesurable si 
quel que soit FeG , on a T''(FjeS. On supposera, dans ce qui 
suit, T mesurable et, si Y est un espace euclidien, on suppo— 
sera que © sera composé des ensembles boréliens. Si g est 
une fonction définie sur YŸ , on désignera par gT la fonction 
définie sur X par l'égalité gT (x)=g(T(x)). Si est une me- 
sure définie sur S ,MT' sera la mesure définie sur%par l'é- 
galité..uT'(F) =H(T" (Fr)). On établit aisément l'égalité 


(2) JS 7 au rt (7) = 7 fier (à) ay (x). 


F) 
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Si M et V sont deux mesures définies sur S et si V est ab- 
solument continue par rapport àu , on aura, d'après le théorème 
de Radon-Nikodym 


VE) = fr (x) ap (x) 


pour tout Eee S +. On écrira aussi cette relation 
dv = f dh 


Il est facile d'établir que si V est absolument continue par 
rapport à M , alors vT' est absolument continue par rapport à 
pT'. On aura donc 


dnT Es dut 


g (y) sera appelée [Vi], [III] l'espérance mathématique condi- 
tionnée de f (x) pour y fixé. On la désignera par eu (f 7 ya) 
Si TI=PXe est la fonction caractéristique d'un ensemble 


Ee S , ex (f/y) sera appelée probabilité conditionnée de E pour 
y_ fixé. On la désignera par py (E/y). 


L'équation définissant e,(f/ y) s'écrit 
j fr (x) du(x) = [ex (t/5) a À paie AS 
T(F) F 
et celle définissant p,(E/y) s'écrit 


(3) pŒnT" (mn) = f pe (E/y) apr (), Fes. 


F 


Soit M une famille de mesures SUD SRI Ondira que sr 
est une estimation exhaustive pour M si, quel que soit EEeS , 
il existe une fonction mesurable = (E/y) sur _Y telle‘ que 
pour tout pe M 


Pk(E/ y) =-p. (E/ y) 


soit vérifiée sauf sur un ensemble de valeurs y de mesure UT 
nulie. Cet ensemble de mesure nulle dépend évidemment de E. 


Appliquons ces notions au cas qui nous occupe: 


L'ensemble X sera B".Un point E de X sera (x°,x°,,.,..,x"%), où 
xVe B. L'ensemble Y sera B. S sera le plus petit corps boré- 
lien contensut les ensembles E, x E, x...x E., où E.@.K. & sera 
K. L'estimation T sera donnée par 


n=T(E) = + (x + x 4. + axe Y. 


La famille M de mesures H sera celle qu'on obtient 
en prenant sur X les mesures produits des mesures dé- 
finies par la donnée de (ms) sur B ; c'est-à-dire que l'on po- 


sera HU (E, x...x En) = g(E) g(E) ... g(E) ; où g désigne la 
mesure laplacienne définie sur les ensembles de K par la don- 
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née de (m) variable et des À4 fixés. L'estimation T est évi- 
demment mesurable. Cela se voit en “en observant que xo est mesura— 
ble SsSurs 2" 


L'estimation T est exhaustive. Pour montrer que T est une 
estimation exhaustive pour la famille M de mesures, il faut 
montrer que, quel que soit EeS, il existe une fonction mesura— 
ble p = p (E/y) sur Y telle que, pour toute M, 


ph (E/y5) = p (E/ y) 


soit vérifiée, sauf sur un ensemble de valeurs LI de mesure UT” 
nulle. 


Soient E un ensemble de S. où S est le corps borélien 
dans X composé des ensembles de *S définis au moyen des 80 
fonctionnelles fi, f,,...;, f,, et Fe, où %, est le corps boré- 
lien dans Y composé des ensembles de © définis au moyen des s 
fonctionnelles fi,, ..., fi » fisss » ++) fs 


Il est clair que EnT'(F) sera défini par des conditions 


sur les, xl) ; rl, 2, 7 105 V'= I, 2, ..., 5. Dans l'espace 
euclidien fins”, considérons le point E' dont Le de 
sont xf et soit 0 la transformation 6 (€) =E'. est clair 


que Ô est mesurable et £' obéit à une loi D a R* .On 
désignera la mesure pour cette loi laplacienne parp'. 


Soient E'cR'"* défini par E =0 (E) et G'défini par T'(F) =0"(G') 
On aura évidemment 


(4) ROC OT (FER ICE ANT 
Soient aussi , la transformation mesurable définit sur Y par 


Ps — ps (1) = (ns, ; 16, US S 1.) e R° 


et CcR° défini par F=4"(C); et soit À la transformation 
mesurable définie sur R'° par 


pr ATOS One, » Ve, 16 )eR 


1 (@) (n) 
nait tes + xf, ) 


On a évidemment 
D TICE) = OC) NES e Nes 
d'où l'on déduit 


C 


Ds Ds! (C) = M CF) = WATT CF) = 
AGT'(F) = A60"(G')= A(G!) 
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On en tire 
(5) Ge A OC) 


car il est clair que F étant défini au moyen des nr, Seulement 
G' l'est aussi, * 


Cela étant, on a en tenant compte de (4), (5), (3) et (2) 
et en observant que T4; est la mesure sur R°, 


(6) pCŒ an T" (F)) = p(E'n c) = p(E'n A (c)) = 


= fo (pe) ap T's (pe) = [os de (n) an T° () 


où gs (Ps) = pw (E'/p.) est indépendant de 1a mesure H et par 
suite de jp car (EM p.405) p, est une estimation exhaustive de 
la moyenne de la variable laplacienne (x, » Xf,pooe Xf,) « On tire 
de (6) en tenant compte de la formule générale (33, 


J Pr (En) dB TT Con) = f ge En) au TM) , Fes 


Or, on va montrer que g; (p) = g.(p). On aura donc, quel que 
soit ©, , 0, 


(7) JP En) ant En) = fo pr (n) du TE, Fes . 


L'égalité dans (7) étant vraie pour tous les Fe%, quel que soit 
&, 264, elle est aussi vraie pour tout Fe% . Car, comme on le 
voit immédiatement, les ensembles FES pour lesquels l'égalité 
dans (7) est vraie, forment un corps borélien. Ce corps compre- 
nant les ensembles de tous les & >%, ,; il coïncide avec & .On a 
donc 


(8) Jp CE) dut On) = fgu qu, Cm) duT'(n) Fe 


On tire de (8), par application du théorème de Radon-Nikodym, 
pu (E/n ) = gs, Ps. (n) presque partout, 
pr (E/n ) est donc indépendant de h (p. partout). 


La classe des ensembles E€S pour lesquels py (E/N )est 
indépendant de H (p. partout),forme évidemment un corps borélien 
Ce corps comprenant tous les ensembles de Ss quel que soit s, 
puisque s, était arbitraire; il coïncide avec S . Car il est 
clair que S est le plus petit corps borélien comprenant tous les 
ensembles de Ssquel que soit s . 


Ceci achève la démonstration. 
Une propriété de la loi de Laplace dans un espace euclidien. Re- 
venons au point laissé en suspens. Il1 s'agit de montrer que 


gs Ÿ, (n) Ass d.. (n) pour Gs; Ts, . 
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Considérons l'ensemble E',. I1 est défini par des conditions sur 
és © p ="1, 2,1...; 00 300 12/7070, Ney etl on 
Mt 


gs d, (n) 


Il 
(l 


gs (Ps) p (E/ LEE M,» 04.) 


il 


Js ds (1) Use (Ps) P AAA EE Nf,v---> ns.) 


1 (Q (n) 
re = (, Cess TE fi }e 


Changeons les notations. Le problème sera comme suit : 


Soit x=(x, ,x:,...,X%r)une variable dans R' et y=(y,;, Ye » Ye) 
une variable dans R°. On suppose que (x , y) est une variable à 
loi laplacienne non dégénérée dans R‘* ; alors, x et y seront 
des variables à lois laplaciennes non dégénérées dans R'° et R° 
respectivement, 


On considère n déterminations indépendantes (xt) , y) ), 
1-01, 2,05, nn; de, ls Yariable un dans R'* et un ensembie 
borélien Ec R'" -Posonsé=(x) 1=(y" , I<idniléuérs ven 
Dn aux e Roi: néRT ou (.nhe Roy. 


1e 1 n 
On forme = (x Host), Be = + (9Ÿ ++ 7) et Con 
considère les probabilités conditionnelles 
p'(FE CO, es Gr, Pi, Bi: De) 
et 


piC et) no, AT POP 


11 s'agit de montrer que ces probabilités conditionnelles sont 
égales p. partout, c'est-à-dire égales sauf un cas de probabili- 


té nulle, 
Introduisons des variables Zz; par les équations 


PAGE RPNNEN RU exe RÉE xs mit te ki” Xr si = 1,2,..,t 


et déterminons les constantes k! par les conditions que les 
variables Z; soient indépendantes des xj . Il suffira d'écrire 


CONS (2 AM) RTS UNI = on, T1 ST SE ele 


1 Les conditions (9) détermineront d'une façon univoque les 
kÜ) car la loi laplacienne de (x,y7) est non dégénérée, La varia- 
ble z = (z,, 2, ..., Z) obéira à une loi laplacienne indépen- 
dante de 14 loi de x\= (x; ,x.,0.99, x) Soient (sr ON )INTES 
n déterminations indépendantes de (x, z) correspondant aux n 
déterminations indépendantes (x!, yo I de (x, y). On pose 


EE] (1) ; 
Y= (Gi Hal ire B; +kO où, + kK® o,+...+ k1° Nr sel Dre 


œ= (o,0,,...,œ), B=(R,, B:,..., Bt), ions (SR PAST 0 
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Désignons par À la propabilité pour la variable («,8), par x la 
probabilité pour la variable (a,ÿ) dans R'‘* et soit T la cor- 
respondance biunivoque T (a, 83 = (d,y). On‘an = À T'et, si G 
est un ensemble bcrélien quelconque dans R'*t 


p(EeEn(a,B)eG) = præ,B) dx (a,8)-f pT'(@,y)dn(a,y) 
6 
où l'on a posé p, («,) = p (te E/ (a,B)). De plus, 


(10) p(EeEn(x,B)eG)=p(£eEn (œy)eT(6N = f PCESE/(œ,Y))dm (or, y). 
On en tire 


pP(SEE/(a,y}}= p, T'(oœ,y) = pa(a,B)=p(E eE/(x,8B)) p. partout 


Or, comme il est facile de le voir, p (&eE/(a,y)) est p. partout 
indépendant dey et, par suite, p (ÉEE/(x,fB)) est p. partout indé- 
pendant de f. 


Pour voir que p (£eE/(a,B)) ne dépend p. partout que dea, 
observons d'abord queœet Y sont deux variables laplaciennes 
indépendantes, Soient ® la mesure pour & et Ü) la mesure pour YÿY , 
n'étant, comme ci-haut, la mesure pour (x,y). 


Soient F un ensemble borélien de R° et G un ensemble 
borélien de Rt,. En observant que l'évènementyÿe G est indépendant 
des évènements £eE , Ge F , on obtient 


(11) [PE EN dn (an= p(EeEntarreFxG)= p(séEnaéFnye0)- 
= p(éeEnaer) p(yeG) = [ag tn fotéetlo)dg(e)-f pEeE/o)én (oi, y), 


d'après le théorème de Fubini. Or, les ensembles Qc R'* pour 
lesquels 


JPG eE/(oy)) dn(o,y) = [p(eE/o)an(o,r) 


forment un corps. Ce corps comprenant, d'après (1]), tous les 
ensembles F x G où Fc R°' et GcR° sont boréliens;il comprend 
tous les ensembles boréliens de R'** . Le théorème de Radon- 
Nikodym donne alors en tenant compte de (10) 


p(EeE/(a,B)) = p(£eE/(a,y)) =p(£eE/a) p. partout. 


Ceci achève la démonstration. 
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SUR LE THÉORÈME LIMITE CENTRAL 
POUR DES VARIABLES ALEATOIRES 
DANS UN ESPACE DE BANACH 


par 


Shafik DOSS 


Dans un espace de Banach B, on dira que la variable aléa- 
toire x est laplacienne si, pour toute fonctionnelle linéaire 
f, la variable aléatoire numérique f (x) est laplacienne [VIï] 
Il revient au même Le dire que pour toute combinaison finie’ de 
fonctionnelles fn, ... la variable aléatoire 
EM AE x), 7. 3of, . x} )e R° ER laplacienne [VI] 


L'objet du présent travail est de montrer que, sous certai- 
nes conditions, si x est une suite de variables aléa- 
toires indépendantes dans l'espace de Banach B, la variable 
Voi= ÜX, + oc. + x, Mn converge, au sens de Bernoulli, vers une 
variable laplacienne. C'est l'extension, au cas qui nous occupe, 
du théorème limite central du calcul des probabilités. 


"Un cas particulier de ce théorème a été étudié par E. Mourier 
(IX). C'est le cas où B est un espace de Hilbert séparable et où 
les x; ont la même distribution avec m ({x;f)<oo (i = 1,2,...,n). 
Un cas un peu plus général a aussi été considéré par Fortet et 
Mourier (X)". 


Introduction, Soit B un espace de Banach, l un corps borélien 
de sous-ensembles de B et h une mesure (probabilité) sur les 
ensembles del . Soient f, ; f:9 +++ fn des fonctionnelles liné- 
aires quelconques définies sur B et ai, bi,-00 < a;i< b;< +o, 
des nombres quelconques. L'ensemble des valeurs de xeB pour 
lesquelles 


(1) a; < f; (x) < b; 9 i = l, 27 CEE n 9 


avec le signe d'égalité pour ai = -00 et pour bi= +00, sera ap- 
pelé un intervalle£ de B. On supposera que tous les interval- 
les appartiennent à 1 et on considèrera le plus petit corps bo- 
rélien K contenant tous les £ . La mesure pm sera considérée 
EUTIRKSS FE est Le de ne déterminée par sa donnée sur les 
intervalles £ [VIII]. 


(1) Les nombres entre crochets renvoient à la Bibliographie à la fin du 
mémoire. 
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Se donner une variable aléatoire x sur B ne sera as 
autre chose que se donner la mesure our les ensembles de K. 


Soient x, ,X: »°Xn des Variables aléatoires indépendantes 
définies sur B., Cela signifie que dans l'espace B° des points 
(x: Xay +. Xn), les ensembles de la forme,x Lx... x£r ont 
pour mesure p(£,x...x$,) = HA(£) pe(b) ... HE). La mesure dans 
B" sera alors définie de façon univoque sur le plus petit corps 
borélien K!” contenant tous les ensembles de la forme £,x £,x.. . Xbn. 


Soit T La transformation y, = TOR » de De OR Xn JE Be 


I1 est clair que T est mesurable en ce sens que si ŒekK, on a 
T' (&)e K‘*,. On posera pour la variable aléatoire y; 


bn(&) =  p(T'(&)). 


Ainsi, la donnée des variables aléatoires indépendantes 
Xi 9 vo Xn détermine la mesure un Sur les ensembles de K, c'est- 
h-dire la variable aléatoire y,= TE NUE 
Les espaces S et (, d'après le modèle de Doob. B étant donné 
l'espace conjugué B* dont les éléments sont les fonctionnelles 
linéaires f définies sur B est déterminé. Considérons l'ensem- 
ble Q des points (xy)feer , —00< x < +00 et le sous-ensemble 
&, composé des points (x;) tels qu'il existe xe B pour lequel 


f(x) = x pour tout f . 


Il1 est clair que la correspondance, ainsi établie, entre les 
points de B et ceux de Q, est biunivoque. 


Dans la suite, (, remplacera B et il sera toujours consi-— 
déré comme plongé dans Q. 


Un intervalle L de $2 sera l'ensemble des points de Q qui 
satisfont à des conditions de la forme 


(2) ai< xs < Di 3 i1=1,2,..., NO ÿ -00< a; < b; < +00 


avec le signe d'égalité pour a; = -00 et pour b;= +oo. Tout in 
tervalle sera considéré comme un voisinage dans & de l'ensemble 
des points qui lui appartiennent. {à devient ainsi un espace to- 
pologique compact et les intervalles forment, par leur défini- 
tion même, un système fondamental de voisinages ouverts EAA 


On sait que tout espace compact est susceptible d'une 
structure uniforme et d'une seule [I] . Nous considérerons Q 
comme espace uniforme et les entourages V qui définissent la 
structure uniforme seront pris ouverts. (, sera muni de la 
structure uniforme induite par celle de $ . Un intervalle L( 
de ®, sera tout ensemble de la forme L,R,, 


B étant muni de la mesure sur K ; à tout intervalle £ 


de B défini par (1), il correspond un intervalle L de & dé- 
fini par (2) et un intervalle L( de Q, . On définira la mesure 
m de L par 


(3) m (L) = (x) 
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pour toute fonctionnelle linéaire f . Supposons aussi que les 
quantités 


3e. = Mf, (ao) fs fes) 


existent pour tout n et pour tout couple f,, f, de fonction- 
nelles linéaires. On supposera de plus que pour tout groupe fini 


de fonctionnelles Êi s ay cos fx» les conditions suivantes sont 
satisfaites 


2 Ne = \e (FFSe 15216284k) 


T=41 


(i) lim . 


où les ÀX,, ne sont pas tous nuls 


(ii) lim L > 


Ts 


ae IX] dFR = 0 pour tout £ > 0 


où P, est la distribution de la variable (f,(x.,),...,f, (x. )tR* 


ét [X 1 m0 x] +... + [8 x]! 


Alors, d'après un théorème connu PRE ps 113), la loi de 
distribution de la variable (f, (y, }, ..., f.,(ÿn)€e R' converge 


vers la loi laplacienne dont les premiers. moments sont nuls et 
les seconds égaux à X,.. 


Passant à $ et Q, 3 si l'on désigne par g la mesure la- 
placienne qu'on vient de décrire, cette mesure sera définie sur 
tous les intervalles L de Q et, d'après ce qu'on vient de 
montrer, on a 


lim m, (L) = g (L) pour tout intervalle L. 
n + 00 
Pour que la mesure g puisse être définie sur les ensem- 
bles du corps K!°dans Q,, il faudra, d'après la Remarque, que 
à n 
Sè,c U L; implique lim g (U L')arrs 
Nous supposerons, dans la suite, cette condition satisfaite. 
C'est une condition sur les À, .« On peut alors poser 
g® (AM) = g (A) pour A, = AnQ,ek" 
et l'on aura 


lim mE(L®)= g (L®) pour tout intervalle L de (à. 
n +00 


Pour pouvoir affirmer que la loi m® converge, au sens de 
Bernoulli, vers la loi gl, il faut montrer que pour tout en- 
semble de continuité A pour g‘[V] ,; on a 


lim mp (4°) = g (4°) 
n +00 
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La mesure m (L), ainsi définie, satisfait aux conditions 
de comptabilité énoncées par Kolmogoroff [Vi1] et elle peut 
donc être étendue aux ensembles du plus petit corps borélien K 
contenant tous les intervalles L . Il est facile de voir{Ill] 
que Q, à une mesure extérieure égale à 1. On peut alors pour 
tout ensemble A! de la forme AnQ, où Ae K poser 


(4) mo(AM)s= m (A) 


et si & est l'ensemble correspondant à A dans la correspondan- 
ce biunivoque établie entre B et , , on aura 


mA) = p (4) 


et mlsera définie sur les ensembles du corps borélien K!° com- 
posé des ensembles A, Ce corps K'\° correspond au corps K 
dans la correspondance entre B et D 


Remarque. Si n'est pas initialement donnée sur l , mais seu- 
lement sur les intervalles£ de B ; alors on peut toujours po- 
ser l'égalité (3) et, si les conditions de Kolmogoroff sont sa- 
tisfaites pour m , on peut étendre la mesure m aux ensembles 
du corps K . Mais pour que l'on puisse écrire (4), c'est-à-dire 
étendre m‘°au corps K‘ ou, ce qui revient au même, étendre 
au corps K , il faut et il suffit que la mesure extérieure de 
G, soit égale à 1, c'est-à-dire que l'on ait m (U Li) = 02 
pour toute suite d'intervalles Li, telle que Q,elL;. 


Considérons, par exemple, une mesure définie sur les in- 
tervalles£ dans l'espace B des fonctions x (t) continues sur 
(0,1). Soit (ti) une suite de points de (0,1) convergeant verst. 
Considérons les intervalles 
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Il est clair que l'on peut supposer u définie de telle sorte que 
u (£:) =; avec Z œ&; <i et que les conditions de compatibilité de 
Kolmogoroff soient satisfaites (H pourra même être telle que les 
variables x (t;) soient indépendantes). Alors, on aura $, c UL; 
puisque, x (t) étant une fonction quelconque de B , elle a une 
valeur finie en t et, comme elle est continue ent, on aura pour 
i assez grand: | x (t)|<i . Mais on a cependant 


n n n 
MU Li)= p(UL)< L œi< Loi <: 
et par suite 
m (U Liobt 


(, n'est donc pas de mesure extérieure égale à 1 et la mesureune 
peut être étendue à K. 


Le théorème limite central. Supposons maintenant que les varia- 


bles indépendantes x, aient toutes pour valeur moyenne Ô {zéro 
de l'espace B), ou, ce qui revient au même, que Mf (x,) = O 
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Pre dira que A est un ensemble de continuité pour 


Gps pour toute >0 donné, on peut trouver un entourage 


Vo de S, tel que: 


Q € K et Q c y © (A®) implique g( (Q) < g (1 (AM) +E 
(5) | 
Re K® et Roc V‘ (A") implique gt (R) < gt (AM) +e 


où A'" désigne le complémentaire de Al par rapport à Q, . 


Soit donc A un ensemble de continuité et V! l'entoura- 
ge correspondant àe au sens de (5). On a 


VORUAE) eV CAN) RQ ay CA: ) > Am 


où AM est la fermeture de A! dans Q . Or A , ensemble 
fermé de l'espace compact $S , est compact et V (A) est 
ouvert; on a donc 


(6) AC = VAN Del D 
aev(A") 


où LA; désigne un intervalle voisinage du point a . Or les in- 
tervalles, comme on l'a déjà observé, sont ouverts et l'on tire 
de (6) qu'il existe des points a,, a,, ..., a,, en nombre fini, 
tels que 


ES k 
AUUIC Use NH CANDOT 
1=1 
On aura 
k k 1 U 1 
AMC (Up iLs, niet LU Le, eV (A°7) 


et par suite, en vertu de (5), 
(7) g‘ (U 14 ns Pi AO Meter 


De plus, mŸ convergeant vers gl sur toute réunion finie d'in- 
tervalles, on aura pour n assez grand, 


(8) ER RON EN SE AS CN 
On tire de (7) et (8) | 
(9) AA NE SLR EEE TU Er 

et de même 


(10) Na NE Le A AL ab 


(2) Ceci est une adaptation des définitions données dans [v] au cas où les 
VS(AS) ne sont pas nécessairement mesurables, 
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Mais (10) s'écrit aussi 


(11) 


g( (AM) < m ( {AM ) 12e 


De (9) et (11) on déduit que l'on a, pour n assez grand, 


RCA gi (AM) I< NE 


Ceci achève la démonstration. 


U] 


[1] 
[11] 


[v] 
Cv] 
[vi] 


[vir] 


[vzrr] 
[x] 
RS 
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SUR LA CONVERGENCE PRESQUE COMPLETE 
DES MOYENNES DE VARIABLES ALFATOIRES 
(Théorèmes de HSU, ROBBINS et ERDÔS) 


par 


D. DUGUÉ 


Dans un article des Proceedings of National Academy of 
Sciences 1947 p. 25 — 31 , Hsu et Robbins avaient établi la 
convergence presque complète d'un échantillon de variables aléa- 
toires ayant F(x) pour loi de probabilité totale vers { x dF(x) 
si x*dF(x) existe. Erdôs avait ultérieureïent démontré cette 
convergence d'une manière plus simple et établi que les condi- 
tions énpncées étaient nécessaires (Annals of Mathematical Sta- 
tistics —- Vol XX p. 286). J'ai moi-même établi que ces condi- 
tions étaient nécessaires par une autre méthode fondée sur la 
croissance de la plus grande valeur d'un échantillon (publiée 
dans les Actes du 28ème Congrès de l'Institut International de 
Statistique qui doivent prochainement paraître). Je vais indi- 
quer ici une démonstration du fait que ces conditions sont suffi 
santes et qui me paraît plus simple que les deux démonstrations 
données précédemment, Cette démonstration s'inspire de la dé- 
monstration de Kolmogoroff pour la convergence presque certaine. 


Rappelons quiune suite | de variables DL X, X2,, .... X'os.s 
converge presque complètement vers O (Hsu et Robbins qui ont 
introduit cette notion lui donne le nom de convergence complète, 
faute d'un meilleur terme, disaient-ils : je préfère pour ma 
part parler de convergence presque complète), si la série de 
terme général 1 - F,(x) + F,(-x) est convergente quel que soit 
x>0 avec F,(x) = Prob (X,< x). 


Dans le cas où les variables X,, X,, .... X, sont indépen- 
dantes cette condition est équivalente à la convergence presque 
certaine. Mais d'une manière générale elle n'est pas nécessaire 
pour assurer la convergence presque certaine, La condition énon- 
cée pour la convergence presque complète entraîne que toute 
suite de variables Y,, Y,, oo Yyy °.. indépendantes ou non, 
telles que Y, ait même loi de probabilité que X,(dans le mémoi- 
re cité je propose de dire que dans ce cas X,et Y,sont légale- 
ment superposables) converge presque certainement vers O. 


I1 s'agit donc de démontrer que sous les conditions que 
fx d F(x) et f x'd F(x) existent Dites 74 converge presque 


complètement vers f x d F(x) , X,ayant F(x)pour loi de probabili- 
té totale. 
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Cela revient à montrer que la suite de variables aléatoires 


) 
XD) + XD) +... + XM 
n 


converge presque complètement vers / x def (x) PR Ax PL LA 
étant indépendants, quels que soient n, p, i et j.(les variables 
étant indépendantes la convergence presque complète est identi- 
que dans ce cas à la convergence presque certaine). 


Prenons une suite de variables Y® , y? , y, ...Y (9 
s. Y M  ,.. indépendantes et ainsi définies : 


Ye L OX Men Te 0 NI En 


A) Montrons tout d'abord que 


a —— converge presque complètement, 


sous les conditions indiquées, vers fx d'F(x). 


Ce fait est une conséquence des résultats de Borel et de 
Cantelli utilisant l'inégalité de Tchebycheff et par conséquent 
pouvant être interprétés comme des déionstrations de la conver- 
gence presque complète. 


Si la série des moments du 4° ordre de S,— E (S,) converge 
et si E (S,.) tend vers une limite a , la série ayant pour terme 
général 


Prob{|S,-a|>t} converge quel que soit € positif 
E(S,) tend vers /xdF(x)car : 
1 +n 
E(S,)= [E C'ADERSESS +E(Y®)| et E(Y®)= fl" xdF(x) tend vers 


VE d F (x) quand n augmente indéfiniment. Il en est donc de même 
de E (S,). 


De plus pour une même valeur de n tous les Y!(” ayant même loi de 
probabilité on a : 


{ . 3(n- 1) 2 
E(S,-E(S,))= SR AUNRE VAR Pop aerreer E RE - Ecp))"| 
1 F s 
Posons 3 u, = — E (vw -E(Y(®)) et VW = 3(n-1) E(Y®.E (vi): 2 
n° n° i i 


Il s'agit de montrer queZu, et }_v, sont convergents. 


La série 2;v, converge puisque (VOL EVANS (x) 
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On a : 


u,=E [ve-evm)| = [xt aF(x)-4E(Y®) JU xt F (x) 


nt 


+ 6 [E |" JE x’dF(x) 
-alewm)|" 7" xdF(x)+ LE cv) 
Comme ss xdF(x) et VE x°dF(x) tendent vers une limite quand 


n augmente indéfiniment, la démonstration de la convergence de la 
série}u,revient à établir que : 


1 +n 4 1 +n 3 
». sx ar et 2 dE ix) 
sont des séries convergentes 


si JS x'àaF(x) existe, Pie x'a F Go |<n fx'dF (x) donc la secondesérie 
converge, ù 


On a : 


D /ixar-EI[E =] «arc | 


p=t nzp 


£| br — fx ar 0 | 


1 
n° 
æ 1 2 s 
DC 4002 pale dal et par suite : 
1 ns Le P 2 3 = (p-1) : + , 
= dF(x) < 23, fx dF(x) + PEa EE x’dF(x) = 2e 4 F(x) 


La série dont le terme général est Prob [[s.-/xar@l>el 
est donc convergente. 


B) I1 suffit maintenant de montrer que sous les hypothèses fai- 
tes 


Sabine At 2e +X (M) 
—— - S, converge presque complètement vers O. 
n 
Or : 
X (M + PRE + X : re -Y(® PAR er IN AOUEE d'a 
PRE PR | EE TN RER EE OR | LE 
n S n 


Si quel que soit. i on a | DENTS) EEE ON ART 


Le < 
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Donc puisque XORESAN est indépendant de X(® - Y® 
n xt) rs ER br < X (n) 
Prob [| | x = vu <x | < Prob | pt Se 
(NPA 2 (n) n 
SR, s, | > x e 1- [Prob Sen «x | 
n 


ei 


en[1- | Prob} | SRE 


Prob | pCLEES AE D x | > F(n)-F(-n) 


et finalerent 


| XD +... D AN 


Prob — S 


n 


SX J<n[i-rim. F(n) 


Si /x'a F(x) existe on sait que la série de terme général 
n|1-Fin) + FEn)) 
converge ce qui établit la convergence presque complète de 


vers O et par suite le théorème. 


LES PROCESSUS STOCHASTIQUES " 
EN DÉMOGRAPHIE 


par 


D. D. JOSHI 


INTRODUCTION 


La théorie classique de la démographie emploie, pour résou- 
dre les divers problèmes posés, une méthode de raisonnement que 
nous appellerons ici la méthode déterministe, Cette méthode se 
base sur l'hypothèse suivante : 


"L'état" de la population à n'importe quel instant t?t peut 
être prévu si l'on connaît son "état" à un instant anté- 
rieur to<t; les seules incertitudes dans cette prévision 
sont dues à la variabilité des taux de mortalité et repro- 
duction. 
La théorie a été développée par plusieurs auteurs et une étude 
systématique et détaillée se trouve dans Lotka (10), Kostitzin 
(9, , et Rhodes [12(2). 


Cette méthode a trouvé pas mal d'applications et a bien 
servi à résoudre plusieurs problèmes pratiques. Mais il est évi- 
dent qu'une étude plus satisfaisante du problème doit tenir 
compte des variations dues au hasard et ici la théorie détermi-— 
niste ne nous sert pas. C'est seulement une méthode probabiliste 
qui pourra nous fournir une idée de la grandeur de ces varia- 
tions. 


Le point de départ de la méthode probabiliste est le sui- 
vant: 
Etant donné "l'état" de la population à l'instant to, il 
existe une certaine probabilité pour que la population se 
trouve dans un "état" déterminé quelconque à un instant 
NET C 


Ainsi, au lieu de considérer l'état dans lequel se trouvera la 
population à un instant postérieur t, on considère la'valeur 
moyenne' des états possibles à l'instant t et les variations 
aléatoires autour de cette valeur moyenne. Vue ainsi, l'évolu- 
tion d'une population humaine peut être considérée comme un pro- 
cessus stochastique, 


(1) Cet article est le développement d'un mémoire présenté à l'Institut de 
Statistique de l'Université de Paris en Juin 1953. Nous exprimons ici nos re- 
connaissances respectueuses à Monsieur le Professeur Georges Darmois à qui 
nous devons l'inspiration de cette étude et qui nous a constamment guidé avec 


ses conseils, 


(2) Les chiffres entre crochets renvoient à la bibliographie à la fin. 
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Depuis peu, divers auteurs ont utilisé la théorie des pro- 
cessus stochastiques pour étudier des problèmes semblables qui 
se posent en biologie. On en trouvera une bibliographie très 
complète dans Kendall [8]. Cependant, quant à la démographie, 
jusqu'à présent on ne s'est occupé que du problème de croissance 
d'une population pour lequel divers modèles stochastiques ont 
été proposés. A notre connaissance ce travail, bien qu'élémen- 
taire, est la première étude systématique des problèmes de la 
démographie mathématique du point de vue de la théorie des pro- 
cessus stochastiques. 


La première partie de cet article donne un résumé des résul- 
tats bien connus de la théorie classique. Dans la seconde partie 
après avoir développé le modèle du processus simple de naissance 
et de mort selon la méthode employée par Kendall [6] , nous con- 
sidérons le problème d'estimation des paramètres qui définissent 
le processus. Dans le cas général, la solution de ce problème a 
été obtenue par Kendall [8] et Moran [1] . Nous avons montré 
qu'il existe une solution simple pour le cas démographique, 
qu'on peut obtenir par la méthode du maximum de vraisemblance. 
Dans la troisième partie nous avons étendu ce modèle au cas 
d'une population comprenant deux types d'individus. Nous avons 
montré qu'en utilisant un modèle stochastique à deux variables 
on peut étudier la différence entre le nombre d'individus du 
sexe masculin et celui du sexe féminin dans une population hu- 
maine. Le problème d'estimation dans ce cas a été résolu par la 
méthode déjà utilisée dans la seconde partie. Enfin, dans la 
quatrième partie, nous généralisons le problème au cas où les 
taux de natalité et de mortalité dépendent de l'âge de l'indivi- 
du, Bien que ce problème soit encore loin d'être résolu complè- 
tement quelques résultats intéressants ont été obtenus, en uti- 
lisant la théorie des processus de Poisson généralisés. 
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PREMIÈRE PARTIE 


LA THÉORIE DÉTERMINISTE 


La théorie déterministe, due en grande partie à Lotka, se 
base sur les fonctions suivantes: 


le nombre de naissances "annuelles" à l'époque t, 
le nombre des morts "annuelles" à l'époque t, 
taux de natalité, 
le taux de mortalité, 
la fonction de survie, qui est la proportion des individus 
nés à l'époque t-a qui sont encore en vie à l'époque t, 
ayant alors l'âge a. Cette fonction qui, en général, dé- 
pend de l'époque t, est supposée indépendante du temps, 
f(a) la fécondité effective du sexe féminin à l'âge a, définie 
comme le nombre de filles nées vivantes par an "per capita” 
de femmes d'âge a. On la suppose aussi indépendante du 
temps. On introduit aussi les fonctions f,(a), f2(a),..... 
+..fn(a) où fh(a) est le nombre de n-ièmes naissances par 
femme d'âge a. 
A partir de ces fonctions on obtient des résultats bien connus 
de la démographie mathématique. Ainsi, si l'on suppose que les 
taux de natalité et de mortalité sont constants et ne dépendent 
pas du temps on a la loi exponentielle de la croissance ou 
loi malthusienne. Si, au contraire, on suppose que n(t) et m(t) 
sont fonctions linéaires du nombre d'individus à l'instant t,on 
a la loi logistique de croissance. 


Si l'on désigne par NE (ti) le nombre d'individus que com 
prend la population à l'époque t, on a les relations suivantes: 


(1) a 


TEE Z 
D + et er cr 
bd 
Le] 


Il 


N(t) - M(t), 


(2) y(t) = ['NGt-a)p(a)aa, 
(3) N(t) = f N(t-a)p(a)r(a)an, 
(4) M(t) =-/ N(t-a)L(a) da 


(e} 


On définit encore un coefficient de répartition par âge 
c(a,t), tel que le nombre d'individus compris entre les âges a 


et a+da soit 7 (t)c(a,t)da. 11 s'ensuit que 


(5) y (t)e(a,t)da = N(t-a)p(a)da, 


156 DADMIOSHI 


(6) c(a,t) ne p(a), 


oo 


(7) J'etast}aa ee 


Oo 


On a aussi les relations suivantes qui lient les taux de natali- 
té et de mortalité au coefficient de répartition par âge. 


(8) n(t) = AH = e(0,1) 


(9) m(t) = - Jreta)#19s20e) da 


© 


Si le coefficient c(a,t) est indépendant de t, tel que l'on 
peut l'écrire simplement c(a), on a 


(10) n(t) = c(0) = constante 
RAR 
(11) m(t) = — on) = constante. 
o 
Et ainsi 
(12) = n(t) - m(t) = constante = r 
ou 
(13) rx =" 


et la population croît (ou décroît) d'après la loi de Malthus. 
Si, au lieu de supposer que le coefficient c(a,t) ne dépend pas 
de t, on avait supposé que les taux de natalité et de mortalité 
sont constants, il se serait ensuit que le coefficient c(a,t) ne 
dépend pas de t. Ainsi donc une population malthusienne est ca— 
ractérisée ou par l'indépendance par rapport au temps des taux 
de natalité et de mortalité ou par l'indépendance par rapport au 
temps du coefficient de répartition par âge. 


Pour une population malthusienne on a, de plus 
(14) N(t) = ney(t) = nyet= Nef 
(15) M(t) = my(t) = myet= M ert 


tel que les naissances et les décès annuels obéissent à la même 
loi, 
Etudions maintenant l'équation importante 
œ 


(16) N(t) = [ N(t-a)p(a)r(a)aa 
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dite équation de Lotka. On sait bien qu'il existe une solution 
sous la forme de la série exponentielle 


(17) N(t)=Qe + 0 e 2 


où les coefficients Tn sont les racines de l'équation 


PAL 
+0@,e 3 Ho... 


(18) 1 = [lee p(a)r(a)da 


et les coefficients Q, dépendent des conditions initiales. 


La fonction p(a)f(a) étant réelle et positive, on démontre 
que l'équation (18) ne peut avoir qu'une seule racine réelle P» 
telle que 


p2 O suivant que Ro à 1 
où 


(19) Rro= f p(a)£(a)a. 


(eo) 


Il est évident que R;, que l'on appelle le taux net de reproduc- 
tion, est le nombre moyen d'enfants qu'a une femme pendant la 
durée de sa vie. 

On démontre aussi que pour toute racine complexe 


T'= # + iv 


on a 


U< p 


de sorte que l'amplitude relative des oscillations, par rapport 
au terme apériodique Qp eP° va en diminuant, et, en fin de compte 
c'est ce terme apériodique qui domine l'évolution des naissances 
car par rapport à lui tous les autres termes de la solution de- 
viennent négligeables. On a alors 


(20) N(t) = op eP* 
Du moment que la formule (20) est applicable, on a 
© 
(21) x (4) = // N(t-a)p(a)aa 
[e) 
= kePt (k=une constante). 


Nous avons donc, dès lors, une population malthusienne augmen- 
tant ou diminuant selon le taux d'accroissement constant o <Pour- 
vu que la mortalité et la fécondité soient indépendantes du 
temps, le taux d'accroissement s'approche de plus en plus de la 
valeur asymptotique , ou taux intrinsèque d'accroissement, 
quelle que soit la répartition initiale par âge et les taux de 
natalité et de mortalité. Ainsi p exprime la capacité fondamen- 
tale de multiplication de la population, libérée de l'influence 
perturbatrice d'une répartition initiale arbitraire par âge. 


Nous terminons ici ces remarques brèves et rudimentaires 
gur la théorie classique. Dans la seconde partie nous allons 
considérer ces problèmes du point de vue probabiliste. 


158 D. D. JOSHI 


DEUXIÈME PARTIE 


LA THÉORIE STOCHASTIQUE 
Le processus simple de naissance et de mort 


La théorie des processus stochastiques, celle des processus 
markoviens en particulier, nous permet de construire des modèles 
semblables aux modèles déterministes, pour étudier les divers 
problèmes démographiques. Nous emploierons les méthodes déjà 
utilisées par divers auteurs pour é udier le développement des 
colonies de bactéries en les modifiant selon les conditions spé- 
cifiques des problèmes de la démographie humaine. Pour construi- 
re ces modèles nous n'avons besoin, pour le moment, que des deux 
fonctions, les taux de natalité et de mortalité, que nous défi— 
nissons ci-dessous. 


LES HYPOTHÈSES 


Soit A(a,t) etp(a,t) les taux par âge de natalité et de 
mortalité respectivement définis ainsi qu'il suit: 


(i) un individu en vie à l'instant t et ayant l'âgea, a la 
probabilité 


X(a,Ddt+o(dt) 


de donner naissance à un autre individu (de ltâge O) dans l'in- 
tervalle de temps (t, t+dt); 


(ii) un individu en vie à l'instant t et ayant l'âgea, à la 
probabilité 


m(a,st)dt+o(at) 
de mourir dans l'intervalle de temps (t, t+dt}). 


De plus, nous supposons que les sous-populations produites 
par deux individus de la population se développent indépendam- 
ment l'une de l'autre et que la probabilité de naissance et la 
probabilité de mort sont indépendantes, la probabilité de repro- 
duction et de mort simultanée (ainsi que la probabilité de plu- 
sieurs naissances) étant considérées comme inférieures à dt. Aussi 
nous ne nous occupons que de la partie féminine de la population 
et supposons que le nombre d'individus du sexe masculin s'âjuste 
en conséquence. 


LE PROCESSUS SIMPLE DE NAISSANCE ET DE MORT 


Supposons d'abord que les fonctions À (a,;t) et up (&œ,t) ne 
dépendent ni de l'époque t ni de l'âge à telles que l'on peut 
les considérer comme les constantes Xetpu,. Nous avons en ce cas 
le processus simple de naissance et de mort. (voir Kendall (6). 
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Soit y, la variable aléatoire qui désigne le nombre d'indi— 
vidus dans la population à l'instant t et soit P(t) la proba- 


bilité pour que ÿ, =n, et supposons que Y, =n, 


La probabilité Pn(t) satisfait aux equations différentiel 


les 
OPA 
(2) ed nGap)Pe (4)+ (m1) Pas (4) (mtDpPu (4), nD1 
dP, (t 
(23) RE) 2 hr,(t), 
avec les conditions initiales 
(24) Pre (0)=1 5 M (0)-0, n#n, 


En prenant P,(t)-0 pour n<0, la fonction génératrice 


+00 
(25) p(zt) = 2, Palt) 2° 
satisfait à l'équation linéaire aux dérivées pariielles 
LA NNES GE ya 
(26) St = (Az-u) (z-1) F. 
avec 
(27) p(z,0)= 203; gp (1,t)=1. 
La solution générale de (26) est de la forme 
Az -(A-u) t 
(28) p(z,t) = UE n Ht} 


et tenant compte des conditions initiales, on a 


ere (A-p)t1no 
(20) RAÈME 2 (1-z)u e | 


COM er Me 


pH 


P.tt=r nt [51 g% [re] Direrren) | r <no 


(30) x T'{r-x+1)T (no) 
Co pre) dr 


Z 


s par les relations suivantes: 
(31) LB NEA Tia DL ol 
LUN Re PA HIETS En 


où6,n 6 sont donn 
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Si la valeur initiale n,=1l, on a 


PTE) = E 


ÉE) n-1 
Ph(t) = (1-6)(1-n)n n >]1 


De (29) on a 


(33) _ (Apt 


T =E [n]=-etti=ne 


: ktp (au) HE) 
À y 
Ainsi l'espérance mathématique du nombre d'individus suit 
la loi exponentielle et nous retrouvons la loi maithusienne. 


2 
(34) Var m]= pÜit)-m(T-1)=n 


PROBABILITÉ D'EXTINCTION DE LA POPULATION 


Examinons maintenant les expressions pour l'espérance mathé- 
matique et la variance de ÿY .« L'espérance mathématique nous 
donne le nombre moyen d'individus que comprend la population à 
l'instant t. On voit que ce nombre moyen croît exponentiellement 
vers l'infini si Xu, décroît exponentiellement vers zéro si À<u 
et est constante si À =u. La variance de ÿ, tend vers l'infi- 
ni si À>œp , et tend vers zéro siA<u ,lorsque t tend vers 
l'infini. 


Considérons ensuite la limite de  (z,t) lorsque t tend 
vers l'infini. Nous avons 


lim (z,t)=1 AH 
(35) Le u no 
- pe 
Cela montre que 
t — oo n 
HN 
x DH 
et que 
(37) lim Pn(t)=0 n>O mais fini 


Ces limites montrent que pour À<U l'extinction de la popu- 
lation est "presque certaine'"et que pour Dar il y a une proba- 
bilité non nulle (= FH] ) pour que la population s'éteigne, De 
plus, dans ce dernier cas ( \Â>u ) la population augmente sans 
cesse avec la probabilité 1 - (u/X\)' 
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Ainsi nous voyons que pour étudier l'extinction d'une popu- 
lation il ne suffit pas de considérer la valeur asymptotique du 
nombre moyen des individus. Pour la théorie déterministe une po— 
pulation croît sans cesse vers l'infini si le taux d'accroisse- 
ment est positif, et décroît vers zéro si le taux d'accroisse- 
ment est négatif. La méthode probabiliste, au contraire, nous 
donne une idée plus précise de ce phénomène et nous voyons que 
même dans le cas oùÀ=u(c'est-àh-dire E(Y,) = constante) l'ex- 
tinction de la population au cours du temps est presque certaine 


RÉPARTITION PAR AGE 


Désignons par dy(a,t) le nombre d'individus dont l'âge à 
l'instant tt est compris entre les âges a et a +da, tel que 
l'intégrale de Stieltjes par rapport à & 


est le nombre d'individus dans le groupe d'âges (a; ,a)). On sup- 


\ 


pose que la répartition initiale par âge Y (4,0) est connue. Si 
pour les k intervalles non-empiétants d'âges (a.,f-),r=1,2..,k 
on peut trouver la loi des k variables aléatoires 


Br 
5h drio,L) (LE, RU he reok) 


dr 
le problème est résolu. 


Nous ne nous occuperons pas ici de ce problème qui a été 
traité en détail par Kendall [6] et [7] . Cependant, l'espérance 
mathématique et la variance de dy(x,t) peuvent être obtenues par 
un raisonnement simple. 


Considérons premièrement le cas oùa<t. Nous supposons que 
dy(æ,t)-0 avec la probabilité 1 -ô(a,t) da+0O(da) 
=1 avec la probabilité Ô (a,t)da+O(da) 
22 avec la probabilité O(da) 


Alors, au premier ordre, dy(æ,t) suit la loi de Poisson dont 
l'espérance mathématique et la variance sont approximativement 
égales à Ôô(ax,t)dæ,. 


Le nombre d'individus dy(a,t) dépend du nombre des survi- 
vants d'individus nés dans l'intervalle de temps (t-a,t-a+da). 


L'espérance mathématique du nombre d'individus que comprend la 
population à l'instant (t-œ) est donnée par (33) 


ne (A-y) (t-c) 


nm) étant le nombre initial d'individus. Donc l'espérance mathé- 
matique du nombre d'individus nés dans l'intervalle de temps 
(t-a, t-a+da) est 


ne (A-p)(t-a) Ado . 
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La probabilité pour qu'un individu né à l'instant (t-a) soit en- 
core en vie à l'instant t est d'après le résultat (42) obtenu 
plus tard 


en LH 
Donc 
(38) E [y(at)]=n, A (AH (E a) Ha da 
= Var [dy(ait)] 


C'est-à-dire 


(39) Eldy(at)]= 7. er Ne 


Ainsi le rapport de l'espérance mathématique du nombre d'indivi— 
dus appartenant au groupe d'âges (a,a+da) à l'espérance mathéma- 
tique du nombre total de la population ne dépend pas de t, et 
nous retrouvons la propriété qui caractérise une population mal— 
thusienne. 


Dans le cas où a>t, dy(a,t) ne dépend que du nombre 
dy(a-t,0) d'individus dont l'âge à l'instant t-0 est compris en- 
trea-t eta-t+da, les naissances pendant l'intervalle (0,t) n'y 
intervenant pas.Donc dy(œ,t) suit maintenant la loi binome avec 


"n" = dy(a=-t,0) , “pre” bl 


et 
(40) E [dy(m,t)] = e-H ay(a-t,0) 
(41) Var [ar(æ,t)] . (t-e" Bt) dy(a-t,0). 


LA DURÉE DE VIE DE L’INDIVIDU 


Cherchons d'abord la probabilité p (t) pour qu'un individu 
né à l'instant t=0 soit encore en vie à l'instant t. La probabi- 
lité conditionnelle pour qu'un individu existant à l'instant t? 
soit encore en vie à l'instant t+dt est 


1- pu dt+0(dt) 
Denc 


p(t+dt)=p(t) [1=pat+0 (at) | 
sp@) = -p p(t) 


avec la condition initiale 
p(o) = 1 
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Donc 
(42) p(t) = e-Ht 


La probabilité p(t) correspond à la fonction de survie p(a) uti- 
lisée déjà dans la première partie. 


La probabilité pour que la durée de vie d'un individu soit 
égale à T est alors la probabilité pour qu'un individu né à 
l'instant T quelconque soit encore en vie à l'instantt+T et 
soit mort pendant l'intervalle dT qui suit. Ainsi la probabilité 
pour que la durée de vie soit égale à T est donnée par 


(43) ue-BTar 0 LT <o 


LA LOI DE PROBABILITÉ DU NOMBRE DE DESCENDANTS 


Cherchons maintenant la probabilité p. considérée au moment 
de sa naissance (les morts-nés étant exclus) pour qu'un individu 
ait eu r(=0,1,2,3,.....) descendants (ni moins ni plus) avant sa 
mort, 


Considérons d'abord la probabilité pour qu'un individu ait 
r descendants pendant le temps (calculé de moment de sa naissan- 
ce) t. Cette probabilitérn,(t) satisfait aux équations différen- 
tielles 


Ox,.(t) 
«a = An. (t)+An,._,(t) 
x, (t) 
(e] 
gUPIRE TS s 


avec la condition initiale 
n,(0)=1 ; 7x,(0)=0, r>0. 
Ces équations ont pour solution 


(44) n,(t)=i, Cat}e À 


La probabilité pour qu'un individu ait la durée de vie T, 
et ait eu pendant cette durée de vie r descendants (ni plus ni 
moins) est, alors 


(45) = u (AT) e-(M)Tar à 
Donc 
me re-(yT 
er ee (x th'e A H)TaT | 
C'est-à-dire 


1 À ei". = 05192 
(46) PRÈS et Ar nl de r = 0,1,2,... 
On constate que cette probabilité ne dépend que du rapport À/H- 
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La fonction génératrice f (x) des probabilités p.est 


ns FD 
£(x) à den ETS NT 


D'après les résultats bien connus (c.f. Steffensen [13] )la 
probabilité d'extinction d'une population (quand le nombre ini-— 
tial no=1) est donnée par la racine positive la plus petite de 
l'équation 


x = f(x) 


(A x- b) (x-1) =0, 


et cela vérifie les résultats déjà trouvés. 


c'est-à-dire 


ou 


ESTIMATION DES PARAMÈTRES À ET H 


Moran (il et suivant sa méthode Kendall [8] ont obtenu 
respectivement l'estimation de la somme (À+u) et du rapport À /p. 
Ces deux estimations sont basées sur deux échantillons indépen- 
dants obtenus par deux méthodes différentes et on ne sait pas si 
les estimations de X et deu tirées des précédentes seront les 
plus efficaces et absolument correctes. Nous ne considérons pas 
ici le problème général d'estimation des paramètres associés à 
un processus stochastique, mais nous allons obtenir une solution 
exacte et simple dans le cas spécial d'une population humaine. 
Cette solution est obtenue par la méthode du maximum de vraisem- 
blance en utilisant la loi (45) du nombre de descendants qu'a un 
individu pendant la durée de sa vie (compte tenu du fait que 
cette loi est tirée des mêmes hypothèses qui définissent le pro- 
cessus). 


Considérons un échantillon de n individus ayant la durée 
de vie 


Tabac diese. et: ie te 


et supposons que chacun de ces individus ait eu pendant la durée 
de sa vie 


Typlppesesesssssseses Th 


descendants respectivement. 


D'après (45) la vraisemblance est donnée par 


a CO 


Le PRET nt LA 
C'est-à-dire 


log. Z = constante+Rlog À — (X+H)T+nlogh ; 
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où 


R=7r,+ T, + .....+t Th , 


T=T,+ T,+ Sc Th . 
Kous avons alers 


à logZ 2 _r dlogZ_n r 
an À É dp. 4 p 3 
Denc les estimations, des paramètres À et pH sont données par 
A R À n 
(47) ha+ » F=z 


A A 
On démontre facilement que le couple (x , 1) suit asymptotique- 
ment une loi de Laplace-Gauss avec les valeurs moyennes À ety 
respectivement, et la matrice des covariances 


[xp 0 
(48) n 


1 
0 dE 
n 


TROISIÈME PARTIE 


LA THÉORIE STOCHASTIQUE 
Population comprenant deux types d'individus 


Jusqu'à présent nous ne nous étions occupés que de la par- 
tie féminine de la population et nous avions supposé que le 
nembre d'individus du sexe masculin s'ajuste en conséquence . 
C'est d'ailleurs la méthode classique employée dans la démogra- 
phie et ce n'est que récemment qu'on a attiré l'attention sur 
l'insuffisance de cette approximation, (cf. Karmel [4 ).Nous 
allons maintenant étudier la différence entre le nombre d'indi- 
ridus du sexe masculin et du sexe féminin. 


Récemment Goodman [3] a étudié ce problème du point de vue 
de la théorie des processus stochastiques, et il donne une bi- 
bliographie assez complète dans son ouvrage. Nous avions étudié 
ce problème indépendamment en suivant, cependant, la même métho- 
de et les résultats (53) donnés ici s'accordent avec les résul- 
tats obtenus par lui, 


On considère une population comprenant des individus de 
deux types; disons type-Il et type-Il. Les individus de type-I 
donnent naissance à des individus de type-I et type-II tandis 
que les individus de type-Il ne se reproduisent pas. Les indivi- 
dus de type-Il et type-Il correspondent respectivement aux indi- 
vidus du sexe féminin et du #gexe masculin d'une population hu- 
maine. 
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Soit Àp et Aq (p+q=1) les taux de natalité pour les indivi- 
dus de type-I et type-Il respectivement et soit et pu” leurs 
taux de mortalité. Nous les définissons de même façon que dans 
la deuxième partie, tel que, par exemple, un individu de type-I 
en vie à l'instant t a la probabilité 


Afat)+ o(dt) 


de donner naissance à un autre individu de type-I dans l'inter- 
valle du temps (t. t+dt). De plus, nous supposons que les taux 
de natalité et de mortalité ne dépendent ni de l'âge ni de l'é- 
poque t, et que la popuiation se développe sous les mêmes condi- 
tions que pour le processus simple de naissance et de mort déjà 
considéré. 


LES ÉQUATIONS FONDAMENTALES 


Ces hypothèses faites, soit y, et Ôt les variables aléatoi- 
res qui désignent respectivement les nombres des individus de 
type-I et type-II dars la population à l'instant t et soit 
Pm,n (+) la probabilité pour qu'à l'instant t la valeur de Ÿt 
soit m et celle de Ô, soit n. Et supposons qu'à l'instant . t-0 
la variable aléatoire Y, soit égale à L1 et ôt soit égale à zéro. 
(L'extension au cas où les valeurs initiales de Y:et 6t sont 
d'autres que celles-ci est immédiate). 


Dans ces conditions, la probabilité Pm,n (t) satisfait aux 
équations différentielles 


dP.. ntt) F 
Sr A Pa +] (m1) XP nt 
+mA QD (+ (m4) p Ps tn (0) 
+(n+1) pu” Fee (t) 
dP_ ,(t) 
49 0 
seû) = — (ep) Pas, (0 + Um-1) Xp Pr 4,0 (7 
+(met)pPs 0 (+ p' Pr 1(0) 
5 nt) 
ds = nu’ Pontienp, (tu (n+1) Po, n+ 1) 
P, alt) 
0,0 
a We P4 0 ()+p°Po,1 (+) 
avec les conditions initiales 
(50) P4,0 (0)=1 3 Pmn(0)=0, m#1 . 


En prenant PAR IUE) = 0 lorsque m ou n soit inférieur à 
zéro, la fonction génératrice des probabilités 


plasrst}= 3 D Pan CE) go 


LES PROCESSUS STOCHASTIQUES EN DÉMOGRAPHIE 167 


satisfait à l'équation aux dérivées partielles 


e) Ô Ô 
(51) + - (x px? + Raxy = hrpatp) SE + (y) FE + 


La solution de cette équation partielle donnerait la loi du 
couple (y:,6t). Nous n'avons pas pu résoudre cette équation; ce— 
pendant, tous les moments de la distribution peuvent être obte- 
nus de la façon suivante. 


Soit Mrs le moment (par rapport à l'origine), de l'ordre 
(r,s) du couple des variables aléatoires (y.,0). En substituant 
x = eV, y = e"dans l'équation (51) nous voyons que la fonction 
génératrice des moments 

œo do 


r_sS 
u y 
Y (u,v,t) = ds 2e Mrs ri s! 
Le] 


Le] 


satisfait à l'équation 


è _|2Y " oY 
(52) ue [ape Agen pepe per le “| se 
D'où on obtient 
dM 
,0 
re (xp -p)M;0 


LME °M 
Atieut Oo 24m ON 


(53) nn 0 
= CA ptpMio +20X P - MM 


; ) À 
a = 2%, + A ao + H Mo,s -2F Mo, 
et ainsi de suite. 


La solution de ces équations donne les moments et on en ob- 
tient, 


À _ ut 
Me rer LU pt_e-pt | 


Var MIRE ep-pfe(np-pt_;] 
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À Ngler(hpute #7 elrxpehr ut 

Var ÉNÉSSEe | Ces + rs 
ea 27 g? (ap +p JelAP-Ht 
(54) 7 OAp-u+ 2w]7 WTA php) (À p-p +2p) 


+ E [ét] 


x qg(°_x MTL MR (Neue 
cor fe) = [Orepe ft apre PH 
(À pu +p) À Rp-p)t 


De (54) nous avons 


El IR nCX pi + Je (XP -pt 
fe) E[a] 1q [etait HE] 


Si À p— u +uest positif, ce rapport tend vers une constante 


ÀAp-u +u à : 
( Ro lorsque t tend vers l'infini. Si neus suppo- 


sons que les taux de mortalité u et u' sont égaux pour les indivi- 
dus de deux types 


E [y À. e \Pt 
(56) sul ire ae A) 


et nous voyons que dans ce cas ce rapport ne dépend pas de pr .De 
plus, dans ce cas, on a 


lim En] _P 
too E [ét] q 
C'est-à-dire que le rapport est, à la limite, égal au rapport 


des probabilités de naissances d'individus de type-Il et de 
type-Il,. 


(57) 


LA LOI MARGINALE DE y+ 


Soit P (t) la probabilité marginale pour que la valeur de 
Y. à l'instant + soit égale à m. On a donc 


Pi CE) ARR 


n=O 


En utilisant les relations (49) on trouve 
dPn(t 
(58) AIS n(A p+u)Pn (t) + (m-1) À pP,_1(t) 


+ (mrl}p Ph (t) m>l 


Ro Qt) LP (t) 


avec les conditions initiales 


(59) PO) S=CT 5 DUO) SON RE nS 
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En comparant (58) et (59) à (22) et (23) respectivement on cons- 
tate que la variable aléatoire Y+ a pour la loi marginale Ja 
même loi qu'on a déjà considérée pour un processus simple de 
naissance et de mort. Ainsi les résultats obtenus dans la deu- 
xième partie sont encore valables, et la probabilité Pm (t)est 
donnée par (32) où on a maintenant 


PROBABILITÉ D'EXTINCTION D’UNE LIGNE DE DESCENDANCE 


La probabilité d'extinction ne dépend que des individus de 
type-I. Or, le nombre d'individus de type-Il croît (ou décroît) 
selon les résultats déjà obtenus pour un processus simple de 
naissance et de mort. Donc la probabilité d'extinction est 


=. 11 si \p<u 
(60) 

ge nd si \p> 

ere b 


LA LOI DE PROBABILITÉ DU NOMBRE DES DESCENDANTS 


La probabilité pour qu'un individu de type-Il ait la durée 
de vie T, et ait eu pendant cette durée de vie (r+s) descen- 
dants de n'importe quel type est, après (45) 


(61) Cr e6i fée e(AHHT ar 


Et la probabilité pour que de ces (r+s) descendants r soient de 
type-Il et s de type-II est, d'après la loi binome 


r BRAS 
Cris RAA e 

Donc la probabilité Pr,s Pour qu'un individu de type-I ait 
eu r descendants de type-Il et s de type-IlI (ni moins mi 
plus) avant sa mort est donnée par 


+ R F Us x Ti+S (A+ B)T dr 
PeslemdeCres Trrs)i P A (XT) e d 
0 


c'est-à-dire 


Ve 0177 


À À 
62 Pic pa cite -)6— 
( ) (ES r+s À +pu Â+h Dis on 


NH 


S 


Encore la probabilité pour qu'un individu ait pendant la 
durée de sa vie r descendants de type-I est 


co 
- À Pp ap |" 2 
pm) rip UNE Ë - A | POP EENE 


S=0 
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De même la probabilité pour qu'il ait s descendants de type-ll 


est : 
@ ce M raie | « 
pt) = Ê | RS ER 


ESTIMATION DES PARAMÈTRES 


Considérons un échantillon de n individus de type-Il ayant 
la durée de vie 


Ty To, se... 0eeey 57 


et supposons que chacun de ces n individus ait eu pendant la 
durée de sa vie 


1? To LUC NT CCR EC CCE DE UCEC IE : T,» 

descendants de type-Il, et 
S1» S9 9 œ@r0.e16 967016679101 %1010 "9 sh 

descendants de type-IIl respectivement. Et soit 
T=T, + T ss ceosesr Th 
Re T; + To les asso sest Th 
S = 8, TS Ur ...veost Sne 

Alors, pour l'estimation À et mn de À et respectivement on 


ne considère que le nombre total de descendants de chaque indi- 
vidu, et d'après les résultats de la deuxième partie, on a 


SR + 5 ea B, 
(63) NE ? Por . 


Et le couple ( ü) suit asymptotiquement une loi de Laplace- 


Gauss avec les valeurs moyennes À et H respectivement et la ma- 
trice des covariances (48) 


Pour l'estimation de p, c'est un problème d'estimation du 
paramètre d'une loi binome. Donc, l'estimation p de p est 
donnée par 
(64) P=- LS: 

11 est évident que 
E 
(65) 
[ pa/R+S , 
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QUATRIÈME PARTIE 


LA THÉORIE STOCHASTIQUE 
Le processus généralisé de naissance et de mort 


Jusqu'à présent nous avons supposé que les fonctions À (a ,t) 
et u(a,t) sont constantes et ne dépendent ni de l'âge à ni de 
l'époque t. Cette supposition, qui peut être suffisante pour le 
problème du développement des colonies de bactéries, est, cepen- 
dant, un peu trop restrictives pour les problèmes de la démogra- 
phie humaine. Par exemple, nous avons vu dans la deuxième partie 
que la probabilité de survie jusqu'à l'âge a, (voir formule (42) 
a la simple forme exponentielle e VY, Or, la comparaison avec 
une table de survie montre l'insuffisance de cette forme de la 
fonction de survie. De même, il est évident que la probabilité 
de naissance À dépend essentiellement de l'âge à de la mère. On 
peut supposer cette probabilité indépendante de t, mais on ne 
peut pas ignorer que la fécondité dépend de l'âge de la mère. 

Le cas où À et u sont indépendants de l'âge mais dépendent 
de l'époque t a été traité en détail par Kendall [5] et 
Consael fi] . Ici nous laisserons de côté ce problème et examine- 
rons seulement le cas oùAetu dépendent de l'êge à mais non de 
l'époque t. La solution complète de ce problème est loin d'être 
achevée et nous nous contenterons de donner quelques résultats 
particuliers en utilisant la théorie des processus de Poisson 
généralisés. (cf. Fortet et Blanc-Lapierre [2] ). 


LA PROBABILITÉ DE SURVIE 


On suppose maintenant qu'un individu encore en vie à un 
instant t quelconque et ayant alors l'âge &x a la probabilité 


u(æ)dæ + O(dæ) 
de mourir dans l'intervalle (t,t+da). Alors la probabilité de 


survie pa), c'est-à-dire, la probabilité pour qu'un individu 
ait l'âgex, satisfait à l'équation 


p(aida) = p(a) [ 1 -y (a)da - 0 (da) 
c'est-à-dire, 


dp(x) 
da 
avec la condition initiale 


= -p(a)p(x) , 


p(0) = 1 . 
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La solution de cette équation qui satisfait à la condition ini- 
tiale est donnée par 


(66) p(a) = ef Htede, 


Et la probabilité pour qu'un individu ait la durée de vie T, est 


a atne=f He) ne 4h 


LES FONCTIONS DE FÉCONDITÉ 


La probabilité pour qu'un individu en vie à l'instant t et 
ayant alors l'âge à donne naissance à un individu (de l'âge O) 
dans l'intervalle (t,t+da)est maintenant 

A (œ) + O (da). 


A(a) correspond à la fonction de fécondité f(a) considérée dans 
la première partie. 


La probabilité pour qu'un individu ne donne naissance à au- 
cun individu entre les âges ayet x) est 


(68) AS; (a) de 


ct 


Donc,si passait tan) dé dusssd re dacdu, représente la pro- 
babilité d'avoir un enfant dans chacun des n intervalles d'âge 


(a, ,a,+da;,), (ax, ,æ+da,), ...:., (a,,a+da,) 


As Lay Leroerrosse ee 3 An? 


p(a;;@,,......,a,)da, da, ......da, 


Ef"*e EMA (la fe: "ne NCA) de | ons 


(69) n 
Le A(e) da x (a ée,| 


Œn-41 


= À (a, ) Aa)... À (œ,,) e= JA) da da, de « « ..AXg 


Soit maintenant 


Pn(œ) 
la probabilité d'avoir n enfants entre les âges O et à . P, (a) 
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satisfait aux équations 


OP, (x) 

dm 7 (œ)P, (t)+ A (x)P,_j(x) n> 1 
dP, (œ) 

Ro NOR 


avec les conditions initiales 
P0(0) = y np (0) 01, 1 m0 % 


Denc, on a 


(0) P, (a) 


œx 


4e [ Jatarea | SECE 


Si maintenant Jtn (x)da représente la probabilité d'avoir le 
nième enfant à l'âge a-(71, (x) correspond à la fonction f,(a) de 
la première partie)-— on a 


(71) Tnx) = P,_, (a) À (x) 


] 


Î 


mn, [fa tea] free X (x) 


LE NOMBRE DE DESCENDANTS 
Soit pr la probabilité qu'un individu ait eu r enfants 


pendant la durée de sa vie. La probabilité pour qu'un individu 
ait la durée de vie T est 


ne ire 


Et la probabilité d'avoir r enfants entre les âges O et T est 


_ PEONI PACE 


Denc 
2/4 tn) [fa te)aa]" 1 (Neste]é ar 
- [2 hot {Lm+m(n)] a[u(r)] 
où 


[Kad aa (a) 4 fHta)aaau(a) 
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Si L(T)/M(T) est constant (égal à k), on a 
- = Jx [ucr)]" MM] daM(T) 


(72) 
k (1) 
= (1 CE) x = 0,1,2,...1° 


Ainsi, même dans le cas où À et k dépendent de l'âge, la 
probabilité p. a encore la même forme géométrique de (46) si le 
rapport À /y est constant. 


RÉPARTITION PAR AGE 


Nous désignons encore par dy(œ st) le nombre d'individus 
dont l'âge à l'instanttest compris entre les âgesæet a+dx, et 
nous faisons les mêmes hypothèses sur dy(œ,t), à savoir que 
d'y(æ,t) suit asymptotiquement la loi de Poisson dont l'espérance 
mathématique et la variance sont approximativement égales à 
ot, +de. 

Sixt, le nombre d'individus dans le groupe d'âges (œ,x +da) 
dépend seulement du nombre d'individus nés à l'époque t-œet en 
vie à l'instant t. Nous supposons qu'à l'instant t=0 la popula- 
tion comprenait un seul individu (l'ancêtre) de l'âge 0. 


La probabilité que l'ancêtre soit en vie à l'instant t-aest 
sn 
_ (a)da 
e © F Ê 
et la probabilité qu'il donne naissance à un individu à l'ins- 
tant t-œ« est 


Donc l'espérance mathématique du nombre de naissances à l'ins— 
tant t-a et dues à l'ancêtre est 


t-a 


A(t-a)e_ PNR 


L'espérance mathématique du nombre d'individus dont l'âge à 
l'instant t-aest compris entre les âges (6,8+df) est 


Ê(B ;t-x)ap , p<t-a . 


(1) Pour être valable le résultat impose les conditions suivantes 


(i) m (x) =0 pour &æ =0 
(ii) m (a) = pour & = 
(iii) m (a) >o pour & >0 
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Donc l'espérance mathématique du nombre de naissances à l'ins- 
tant t-œet dues aux individus autres que l'ancêtre est 


PROL (Bst-a)4p] da . 


L'espérance mathématique du nombre total des naissances à l'ins- 
tant t-œest 


t-ot 
Pute-agef HU de : [RES t-a)a0 ] #13 


La probabilité pour qu'un individu né à l'instant t-@ soit en 
vie à l'instant t est 


œ 
= sk 1 (8) da 


Donc l'espérance mathématique du nombre d'individus en vie parmi 
ceux nés à l'instant t-œest 


a t-a 
if mterse | at-e L Fe ts ts Le 


=0(t«,t)da , 


c'est-à-dire, à 


- f'nterde | f'atorée jf 


(73) Ô(a,t)=e A(t-aœ)e ENT ,t-œafl 


Ainsi nous avons pour ô(a,t) une équation intégrale. Si l'on 
suppose que seul dépend de l'âge et que pu est constant, cette 
équation se réduit à la forme trouvée par Kendall [6] . 


CONCLUSION 


Dans cette étude nous avons essayer d'utiliser la théorie 
des processus stochastiques en démographie humaine. Notre but 
était de montrer comment l'étude des problèmes démographiques 
peut être faite d'une façon plus satisfaisante par la méthode 
probabiliste et de montrer la correspondance étroite qui existe 
entre les résultats de la théorie déterministe et ceux de la 
théorie stochastique. Ainsi, nous n'avons pas donné les démons- 
trations rigoureuses et complètes pour tous les résultats. Nous 
nous sommes contentés parfois d'indiquer seulement les résultats 
intéressants en conservant en même temps un raisonnement aussi 


simple que possible. 


Signalons ici certaines des conclusions qu'on peut tirer 
de cette étude élémentaire. 


La théorie stochastique n'ayant , à la base que deux fonc- 
tions et p, présente une simplification assez importante du 
problème en comparaison de la méthode classique. Nous avons vu 
qu'à partir de ces deux fonctions on peut obtenir presque tous 
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les résultats de la démographie mathématique. De plus, nous 
avons vu que pour le problème du nombre de descendants et le 
problème connexe d'extinction d'une population aucune autre hy- 
pothèse n'est nécessaire. La méthode d'estimation de À et p dans 
le cas où À et p sont constants peut être généralisée pour le 
cas où À et dépendent de l'âge et peut servir pour une nou-— 
yelle définition des taux de natalité et de mortalité. 


On peut aussi généraliser la méthode adoptée dans la troi- 
sième partie pour tenir compte de la nuptialité et d'autres fac- 
teurs afin d'obtenir une représentation plus proche de la réa- 
lité. 
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CONSIDÉRATIONS STATISTIQUES 
SUR LES POLYGONES ET LES POLYEDRES 


par 


Matthias MATSCHINSKI, 


Ancien Professeur d'Université 


l. PRÉLIMINAIRES. STATISTIQUE DE POLYGONES 


$ 1 — Dans l'histoire de la géométrie on a essayé, et on a 
accompli, plusieurs modes d'extension et de généralisation. Tou- 
tes ces tentatives sont bien connues et il est peu intéressant 
de les rappeler: géométries non-euclidienne, non-desarguienne, 
etc.. Cependant il reste toujours un nombre suffisant de che- 
mins non encore essayés, Un de ceux-ci, et nous l'essayons ici, 
est l'extension du concept du polygone (polyèdre, etc..) intro- 
duisant les polygones au nombre non entier de côtés (les polyè- 
dres au nombre non entier d'arêtes, etc...). Jusqu'ici, d'après 
notre connaissance, on n'a considéré que les figures au nombre 
entier d'angles, de sommets, de côtés, d'arêtes, de faces, etc.. 
Nommons tous ces nombres, les nombres caractéristiques de la fi- 
gure. L'introduction des nombres caractéristiques non-entiers 
peut être réalisé à l'aide d'un système d'axiomes, Mais nous 
préférons, pour premier essai d'une telle géométrie, choisir les 
considérations statistiques qui nous amènent aux nombres carac— 
téristiques fractionnaires ou même irrationnels. De plus, une 
géométrie construite sur la base de la statistique sera tout de 
suite directement applicable aux nombreux problèmes pratiques, 
conservant en même temps toute signification de nouvelle géomé-— 
trie abstraite. 


$ 2 — Ainsi, en considérant les nombres caractéristiques mo 
yens correspondant à une série de figures, nous établissons 
l'extension cherchée dans sa forme primitive. Mais si les séries 
de figures ne sont pas caractérisées par quelque trait spécifi- 
que géométrique, les moyennes sont complètement arbitraires, et 
ne dépendent que de la distribution des figures dans la série 
choisie. Ce ne sera que le sujet d'études dans le sens de la 
statistique générale sur les probabilités, les distributions mo- 
yennes etc... d'une série fortuite, Pour introduire une liaison 
géométrique entre les figures de la série, supposons que ces fi- 
gures couvrent sans lacunes un espace quelconque, plan ou non- 
plan, fermé ou non-fermé, etc.. ( - condition de base ). Les sé- 
ries de polyèdres et de polygones ont été déjà traitées par plu- 
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sieurs auteurs; par exemple H. Minkowskil , ou, pour citer le 
plus ancien: J,. Steiner) . Mais toutes les publications précé— 
dentes n'introduisent pas les considérations statistiques.Toutes 
elles appartiennent à la géométrie classique, non-statistique,et 
elles ne sont citées ici que du point de vue historique. Dans 
les séries "statistiques" déterminées par la condition de base 
mentionnée, les nombres caractéristiques ne sont pas complète- 
ment arbitraires, mais sont liés entre eux, ne laissant que 
quelques uns entièrement arbitraires. Par exemple, les polygones 
dans un plan euclidien sont caractérisés en moyenne, par un nom— 
bre moyen de côtés d'une figure (n) et un nombre moyen de côtés 
s'entrecroisant en un point(u). On peut construire une série 
ayant n'importe quelle valeur numérique, entière ou non-entière, 
de nombre moyen de côté (n) et une autre série ayant n'importe 
quelle valeur de (sur la limite de la variation de n et de 
voir III $ 1). Cependant, dans le premier cas (n arbitraire fixé) 
m ne peut prendre qu'une seule valeur numérique et vice-versa. 
Ainsi, aux exemples classiques des hexagones, des carrés et des 
triangles, couvrant le plan sans lacunes, on peut ajouter aussi 
les pentagones couvrant le plan sans lacunes sous la condition 
que U est égal à 3 1/3, c'est-à-dire sous la condition qu'en 
chaque point s'entrecroisent 3 1/3 lignes. Cela peut être réali- 
sé de plusieurs façons, par exemple de façon qu'en un tiers des 
points d'entrecroisement se touchent quatre côtés, tandis que 
dans les deux autres tiers ne se touchent que trois lignes . 
Cette liaison prend dans le cas du plan euclidien la forme: 
1 1 1 
Mad Ag: () 


comme ce sera démontré par la suite. 


$ 3 - Ce fait peut être trouvé soit comme un fait de la géo- 
métrie expérimentale, soit en partant de considérations théori- 
ques. Nous reviendrons à la méthode expérimentale dans le I11$4; 
ici, nous considérons les raisons théoriques. Dans notre note) 
nous avons indiqué la possibilité de démontrer la relation (1) à 
l'aide de considérations probabilistes, Pour ne pas répéter 
cette démonstration, nous en indiquons ici une autre si simple 
qu'elle peut apDaTé tee presque banale. 


Supposons que notre série de polygones forme un polyèdre 
fini ou infini ayant e sommets, k arêtes et f faces, Il est 
essentiel que les grandeurs e, k, f soient, pour le cas de la 
géométrie statistique d'un espace à deux dimensions, non statis- 
tique, contrairement aux grandeurs, n,H substantiellement sta- 
tistiques. Pour le polyèdre qui est formé par la série donnée, 
la formule d'Euler: 


ÉMIS 2062 (2) 


est valable. Comptons maintenant le nombre de côtés (n) pour 
chaque polygone entrant dans la série et formons la somme de 
tous ces côtés: Din. Chaque côté des polygones touchant deux 
rm la somme obtenue n'est que le nombre doublé des arêtes 
20k)3 

2k= Zn=f Eee 


(3) 
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d'après le concept de la moyenne. En toute analogie on trouve 
Ep 
= = —}— = ANT] 4 
2k = Zu-e Rep (4) 


Substituant (3) et (4) dans (2) on obtient: 
1 l l l (5) 


ME à: CMS 
formule générale pour n'importe quelle série de figures. Si nous 
considérons une série dans un plan euclidien, le polyèdre auxi-— 
liaire, introduit dans la démonstration de la formule (5), sera 
Here grand, le nombre k aussi, et la formule (5) se rédui- 
ratan(1)s 


Pour simplifier l'écriture, introduisons le symbole R a 


pour exprimer + . Avec ce symbole la formule (1) s'écrira: 


Rn+RH=R2 +RKk (6) 


$ 4 - La formule (1)[ou (6)] n'est pas aussi élémentaire 
qu'on peut le supposer à première vue. Il existe une autre for- 
mule presque évidente qui rappelle (6), mais dont le sens est 


Fig. 1b 


essentiellement différent de (6). Considérons la figure 4a . Il 
est évident que 


TtB=7T (7) 


pour chaque triangle, élément de polygone. La formule (7) étant 
linéaire, on trouve de même 


Y+a=7n (parce que a=f) (8) 


pour tous les éléments d'un polygone et, enfin, pour tous les 
polygones. D'après le sens de grandeur n - nombre de côtés d'un 
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seul polygone et  — nombre de côtés se touchant en un sommet,on 
a en moyenne: 


An), [2x | 
a. E Û 
d'où découle 
RU, HNERAPEMPR2E, (10) 


qui est la dite formule élémentaire. Mais on ne doit pas oublier 
que Rñ+4+ Rn ,etc. On voit que les formules (10) et (6) ont des 
formes très proches à première vue. Cependant leur sens est très 
différent; la formule (6) contient en effet les valeurs moyennes 
qui nous sont nécessaires pour la construction de la géométrie 
statistique de polygones, tandis que la formule (10) ne contient 
que les moyennes des valeurs réciproques qui n'ont aucune liai- 
son aveë n,H comme il sera démontré plus bas. Voici un exemple 
illustrant la différence entre les formules (6) et (10) - voir 
figure 1lb, 


cu ikdrbre _ nel. Find Le ist 
DD A De Li Ci mn 420 

(11) 
LSSEPIPRITSES EURO NES jt IPS Sel 
GG 5 Der) 5 G+O)he 2 


Que cet exemple soit constitué de polygones réguliers n'est 
pas important pour la théorie développée. âu contraire, celle-ci 
suppose les séries des polygones complètement arbitraires, régu- 
liers et non-réguliers, disposés en ordre ou disposés en désor- 
dre. Si nous avons choisi ici, et choisirons plusieurs fois ci- 
après, les séries des polygones réguliers et disposés régulière- 
ment, c'est seulement pour la raison que l'estimation des proba- 
bilités et, par conséquent, des moyennes, est beaucoup plus fa- 
cile dans de tels cas, 


$ 5 — La formule générale (5) caractérisant la statistique 
des polygones sur une surface quelconque est représentée sur les 
fig. 2 et 3. Pour cette représentation graphique il est commode 
de récrire cette formule (5) en tenant compte de (3) sous la 


forme: . 
si (ré) G2) 


Sur l'axe horizontal de la fig. 2 sont portées les valeurs 
réciproques de f - fractions de l'angle sphérique total qui cor- 
respondent à chaque polygone; l'axe vertical représente les nom— 
bres de côtés de polygones, Comme on le voit d'après la formule 


(12) ces deux grandeurs (et n) sont liées linéairement, sip 


est constante, Ces lignes droites correspondant aux différentes 
valeurs de » Sont indiquées sur la fig. 2 par des droites 
pointillées; elles ont un point commun A, Leurs intersections 
avec l'axe de n donnent les nombres de côtés de polygones cor- 
respondant au cas d'un plan euclidien: nous voyons ici les va- 


leurs connues n = 3 pour la ligne correspondant à U = 6, n = 4 
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pour la ligne correspondant à = 4, etc..., ainsi que la valeur 
n = 3 1/3 pour la ligne correspondant à H = 5 et n = 5 pour la 
ligne correspondant à u = 3 1/3 


Ayperkotoices sphères 
— = ————— -  —  — — — - —- 


AH 
L exagones Sur un plan (ee faces) 


ss. Potyèdre a 392 Paces 


. 
s 
D 


5h Tetraëècdre 
s 
s 


 Cetaëctie 


GI 
dr 


Pratiquement la ligne limite est la ligne LU = 6, mais du 
point de vue formel, on peut même considérer la ligne = Cor. LIA 
ligne LU = 2 est une ligne verticale AB; elle correspond aux po— 
lygones couplés, formellement représentables par les équateurs 
d'une sphère ou par un plan ayant deux côtés et limités par un 
polygone, un dièdre. La ligne droite 2C représente, soit les 
prismes infinis, soit les méridiens d'une sphère. L'emplacement 
de quelques formes classiques est indiqué sur la figure. Cepen- 
dant, on ne doit pas oublier que chaque point, même l'emplace- 
ment d'une forme classique, correspond en même temps à une infi- 
nité de séries de polygones irréguliers ayant mêmes n et EX que 
n et u de cette figure classique. Comme les formules du (250016 
montrent,à ces deux valeurs données, celles de e,k,f correspon- 
dent univoquement. La dépendance entre n etU pour f donné 


n'est pas linéaire comme celle entre n et f ; 22 voit que 


= q (ñ) d'après la fig. 3. Tout cela est très élémentaire, 
quoique n'ayant jamais été dit dans le sens statistique ; les 
difficultés commencent dans le cas de trois et de plusieurs di- 
mensions, 
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I. STATISTIQUE DE POLYÈDRES ET DE FIGURES 
DE QUATRE DIMENSIONS OÙ PLUS 


$ 1 — La difficulté essentielle de la statistique des polyè- 
dres et des figures à plusieurs dimensions (*) est de même es- 
pèce que la difficulté bien connue de la statisation en hydrody- 
namique: l'impossibilité de calculer la valeur moyenne d'un pro- 
duit à partir des valeurs moyennes de ses sous-multiples. Nous 
appellerons brièvement cette difficulté: "difficulté hydrodyna- 
mique". Par exemple, pour les polyèdres classiques, on a 


e+f=k+2 ; ep =2k ; fn=2k, (13) 


En considérant une série de polyèdres, on doit passer aux 
moyennes; cependant, si la première formule de (13) se transfor- 
me, sans difficultés, en e + f = k + 2, il n'en est pas de même 
des deuxième et troisième formules de (13). Comme on le démon- 
trera ci-après, le procédé qui permet d'éviter cette difficulté 
est très simple, à savoir: pour la statistique de figures à N 
dimensions on doit les considérer comme les éléments d'une su- 
perfigure à N+1 dimensions, considérer les grandeurs caractéris- 
tiques de cette superfigure comme les grandeurs non-statistiques 
et, enfin, revenir à la statistique de figures à N dimensions. 


*) — polytopes, d'après la terminologie répandue, voir p.e. T.N. Schoutel) 
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$ 2 — Expliquons-nous sur l'exemple de séries de poiyèdres. 
Pour abréger nous désignons la superfigure sus-mentionnée comme 
le "monde", Dans le cas de polygones traités statistiquement, ce 
"monde" a été une surface quelconque fermée ou non-fermée, plane 
ou non plane, formant en général un polyèdre non-statistique, 
Dans le cas de polyèdrés traités statistiquement le "monde" sera 
un espace quelconque, fermé ou non-fermé, ayant une courbure ou 
ne l'ayant pas, formant un superpolyèdre. La généralisation de 
la formule d'Euler, pour le cas de quatre dimensions, comme on 
le sait, est (voir aussi II:.$ 5) 


E+F=K+1M (14) 


où E, K, F et M sont les nombres respectifs de tous les sommets, 
de toutes les arêtes, de toutes les faces, de tous les polyèdres. 
Conservons aux lettres » n, k, f, e le même sens que dans la 
partie I. Introduisons encore: U,;-— nombre moyen de toutes les 
lignes arêtes se touchant en un point;U- nombres moyens de 
toutes les surfaces (faces) se touchant en un point; U;,- nombres 
moyens des polygones (corps) se touchant en un point, enfin À 
nombres de surfaces (faces) se touchant par une arête, ou ce qui 
revient au même, nombres des polygones (corps) se touchant par 
une arête. Au lieu d'employer, comme nous venons de le faire, 
l'expression "nombre moyen des éléments se touchant en un point" 
on peut introduire l'expression ‘le nombre des éléments se trou- 
vant statistiquement autour d'un sommet (point)". 


D'après le sens de valeurs moyennes et en analogie complète 
avec la formule (3), on a 


DR 
2K= Ep, =E- EMI QUE : A Ce à er an 


(15) 


ZuæE Ets = HE = Le -mÈe su, analogiquement : 


nE=mE-kMæxk. 


Sur ces formules on doit faire une remarque importante, En 
divisant pour former les moyennes, une fois par E, l'autre fois 
par K, etc.. on n'introduit aucun arbitraire; le choix du divi- 
seur est déterminé par le caractère de la grandeur dont on cal- 
cule la moyenne. Par exemple, en faisant les moyennes de e,k,f, 
on divise par M - nombre de polyèdres, parce que ces grandeurs 
se rapportent à un polyèdre; de même, pour calculer les moyennes 
de Hy,; Us Hs on divise par E — nombre de sommets (points)parce 
que les grandeurs se rapportent à un point, etc. 


$3 — I1 existe un dualisme entre les caractéristiques sta-— 
tistiques des figures pour lesquelles on construit la statisti- 
que et les caractéristiques statistiques d'un point. De même 
une analogie totale existe entre les formules pour les figures- 
éléments et les formules pour les points.Dans le cas de polygo- 
nes on peut remplacer les polygones par les sommets et vice- 
versa d'après le schéma: 


BaSn  ; QG ff : Reæk $ 
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et à cause de la symétrie des formules parvenir aux mêmes expres- 
sions. Dans le cas de polygones il existe la même réciprocité 
qui peut être brièvement exprimée par le schéma 


, K ’ u , n ’ e ’ k 2 G 
stunt) dUGLT ed (16) 
Fi ; fe , À > Ha ? He D pi 


si Simple qu'il ne nécessite pas d'explication. Ainsi, la statis- 
tique de polygones étant établie, les formules 


SR 2 es Mu 2: (17) 


doivent aussi être considérées comme établies en prenant les mo- 
yennes des formules linéaires (voir $ 1 de la partie II). En 
combinant les formules (15) avec (17) on trouve le système: 


2k=ep=Fr ; Rn+ Ru = R2+RK ; 2 = Bis = fu : ps 
RA+RE—R2+Rp ; 2F—FM ; 2K UE RK=KM, 
qui, avec une relation trigonométrique#forment un système com 
plet des équations de la statistique des polyèdres. De manière 
uu peu étonnante on obtient que le signe de moyenne et la multi- 
plication sont permutables 


ep = eu ; Fn= fn 5 Fps= FF 5 br= Rp (19) 


Mais on ne peut pas prévoir ce résultat d'avance et pour chaque 
statistique des figures à N dimensions, on doit de nouveau ap— 
pliquer le procédé indiqué en ayant recours à l'espace à N+1 di— 
mensions, comme nous l'avons fait pour le cas des polyèdres, 


Les formules (18) peuvent être présentées sous des formes 
très différentes. On peut citer les suivantes: forme où les 
grandeurs non-statistiques E,K,F,M, sont supposées être connues 


SOS ESS ZT) 
É de 20 
Le eine dre anus es 
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Nous reviendrons à ces formules dans la partie III, I1 suffit 
ici de souligner que dans (20) il n'entre que les rapports de 
grandeurs non-statistiques, et il n'entre pas de valeurs abso- 
lues; tandis que dans le cas de polygones, les valeurs statisti- 
ques ont été déterminées par les valeurs non-statistiques [voir 
les formules (5) et (12)] .Cela tient à la différence essentielle 
bien connue entre les espaces à nombres pairs et impairs de di- 
mensions, 


$ 4- On voit alors que pour la construction de la statisti- 
que de polygones, de polyèdres, et, en général, de figures à N 
dimensions, c'est la liaison algébrique entre les grandeurs non- 
statistiques de la superfigure, du "monde" qui joue le rôle pri- 
mordial. C'est pourquoi on doit commencer la construction de la 
statistique de figures à N dimensions par la démonstration de 
cette formule liant les caractéristiques non-statistiques de la 
série des figures traitées statistiquement, 


# 
NP RSS nee = ia 


suppri mé 


Fig. 4 


Commençons par le cas des polygones. Remplaçons chaque som-— 
met par un polygone auxiliaire d'après la fig. 4, Le nombre 
total f de polygones de notre série augmente naturellement; 
les grandeurs e et Kk augmentent aussi. Indiquons les gran- 
deurs avant l'introduction des polygones auxiliaires par l'in- 
dice 1, les grandeurs après cette opération par l'indice 2.0n à 


E, —+> e,= eu 2k;; 


fa —— f;=fitre; (22) 
k: ————— ki =kiten=ik:; 


Supposons qu'il existe une fonction @ liant e,f,k,; soit 
(e,f,k) = constante. I1 est évident qu'après la transforma- 
tion (22) la valeur de cette fonction ne changera pas 


ples,fa,ka)=p (2ks,eatfi,3ks) (23) 
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C'est une équation fonctionnelle. Formellement on peut la résou- 
dre en la différenciant. Mais il y a un danger, car ce n'est 
possible qu'en introduisant des hypothèses supplémentaires. 
Cependant, d'après M. G. Darmois() le problème peut être faci- 
lement résolu si on introduit les différences finies, par 
exemple 


e3=e,+À, f3=f, -A (24) 


Ainsi on trouve facilement que 

pes, F1,ki)= pes+f,ks) (25) 
Pour le détail sur l'application de cette méthode(voir G.Darmois). 
En appliquant encore une fois le même procédé on obtient: 


ples,Fs,ks) = pÜesrfi-ki)= const., er+fs-ks= const., (26) 


relation qui formellement coïncide avec la formule d'Euler et 
qui a été déjà appliquée dans la partie I. 


$ 5 - Le même procédé est facilement applicable pour le cas 
de polyèdres. Introduisons autour de chaque sommet un polyèdre 
auxiliaire, (comme on le voit sur la fig.5). Comme précédemment, 


potyèdre 


introduit 


Fig. 5 


appliquons l'indice 1 aux valeurs des grandeurs non-statistiques 
(valeurs caractéristiques du "monde")avaut l'opération introdui-— 
sant les polyèdres auxiliaires et l'indice 2 aux grandeurs après 
cette opération, Alors les valeurs avec l'indice 1 seront trans 
formées dans les valeurs ayant l'indice 2 d'après le schéma 


E; TNT E,= Eu: ; 

KE Ki Et (274 
Fr SR j:6: F= FitE:s Us 

M —> M ME, 


Supposant que la statistique de polygones a été déjà établie, la 
première ligne de (27) s'écrira aussi sous la forme 


Es Er =Epu2E,-Ep (28) 
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Une opération arbitraire ne pouvant changer une relation 
fondamentale, on a 


@(E:,M;  FoKi)= p(Eipi+2E- En, , M4#E, ñ Fi+EFs,Ki+Ep2). (29) 


Le fait que le deuxième membre ne peut pas dépendre de H2 
nous amène à la nécessité d'introduire dans la fonction la dif- 
férence E,-K,3; le fait de l'indépendance de Us introduit la somme 
E;+ Fe 
11 en résulte PE, M:,F1,Ks)= p(2E1+F—Ki,MatEs). (30) 


En appliquant le procédé des différences finies 5) (voir les pa- 
ragraphes précédents) on trouve définitivement: 


PE Mi, F,K4)= p(EstFi-K-M,)— const , 


et: (31) 
E:+F;-K,-M, es const. 


formule appliquée déjà plus haut pour établir la statistique de 
polyèdres. Sur la détermination de constantes dans (26) et (31), 
voir II-$6-D). 


Pour exprimer plus systématiquement les résultats obtenus, 
introduisons les symboles symétriques. Soient M — les nombres 
des éléments à i dimensions; l'expression "éléments" étant emplo- 
yée dans le sens le plus général: M,- nombre de sommets, M:-nom- 
bre d'arêtes etc.., enfin — pour le cas de figures à N dimen- 


sions, — My,, - nombre de "mondes" (M,,, = 1), 

Dans ces symboles on a: 

pour N=0O, MM T2: eo 

pour N= 1, MOtaM =2M; tu TS M;=1 ; (32) 
pour N= 2, Mo + M = Mi+ Mt We 0 

pour N=3, MOHMS EM =IMI MS 40€ M,= 1 ; 


Deux premiers résultats sont évidents: un point dans un 
"monde" linéaire a deux''angles" , deux "côtés" ; et dans une sur- 
face —- monde les figures linéaires forment une "série" ayant au- 
tant de sommets qu'il y a de figures. Les deux derniers de (32) 
représentent les lois d'Euler, classiques et pour le cas de qua- 
tre dimensions. 


Nous venons de donner leur démonstration statistique. 


$ 6 — Généralisons maintenant les résultats (32). Remarquons 
d'abord qu'on peut les représenter sous la forme des sommes 


N=0; D tNm=t; M=1; M=M,....M, = 0 
N=1; > (1) M=1; M=1; M=M....M, = 0 

: (33) 
N= 2; (1) M = 1 ; M,=1; M=M,....M, = 0 


n 
Q] 


Z 
Il 
Le] 
DA8 
St 
LK 
l 
Æ 
| 
= 
I 
< 
Le) 
- 
8 
I 
O 


ñ 
© 
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Alors, on peut supposer que pour le cas général, il a: 


o 
S 1) M= 1; M 
F0 Î Nt1 
N N 
Ici nous avons introduit un deuxième indice auprès de Mi, à 
savoir M; ,indiquant par N le nombre de dimensions des figures 
N 


considérées. La plus simple démonstration statistique de la for- 
mule(34) est celle que l'on peut faire à l'aide de la méthode de 
l'induction mathématique. Etant donné (33), supposons que la for—- 
mule (34) est vraie pour N. Démontrons qu'elle sera vraie aussi 
pour N + 1. La démonstration suit les étapes ci-après. 


A — Appliquons le principe mentionné de l'équivalence géo- 
métrique entre les propriétés d'une figure et d'un sommet. Dans 
ce qui suit, nous préférons ne conserver l'expression "sommet" 
que pour l'usage habituel; nous employons l'expression "étoile" 
pour indiquer l'ensemble des propriétés caractéristiques d'un 
sommet par analogie avec le concept "figure". De l'équation (33) 
qui est vraie comme nous l'avons supposé il découle que pour une 
étoile" les équations 


En Aisne sp FU: Gh l0 
D a dut. La 2 Les Et a de Por (35) 


(36) 


B - Considérons un système quelconque(une série de figures) 
Mi et remplaçons-le par le système Mj’ , en introduisant dans 
chaque sommet (point) une figure auxiliaire, On a alors: 


M Re MS = Mo U: ; 
N+1 N+1 N+1N 
Mise, Ms Mi+ Mo 2 ; 
N+1 N+1 N+1 N+I N RU 
SE Ge UD LR RUES 0 Sen oo ee 
Mas MY — Mn + Mo ns: ; 
N+1 N+1 N+1 NHN 
M Matte, Maitre Mo 
N+1 N+1 N+1 N+1 
d'où naturellement suit l'invariance de la somme 
co à 
sart, (se Le (l 
2 ( ) LU 2 ( 1) ve (38) 
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D'après le procédé déj appliqué, introduisons une fonction 
? exprimant une relation invariante entre M;. D'après (37) et 
(35) cette invariance sera exprimée par 


! — 4 
UM M, , 927 ogg (ot D M,+ M y 27 M TL # TRE ne 1 a ÿ 2H) 

N#41 N1 4 INA N N1 N#1 N N#1 NAN NH1 14 
(39) 


C — Dans la formule (39) le deuxième membre ne dépend pas 
de wi , Utilisant ce fait et introduisant les différences finies 
(voir plus haut), on trouve facilement que la fonction ® à 


12 forme ca 
?("L , sg (LC) “) (40) 
\n#1 N4 N4 tr NS 


c'est-à-dire que 


F(St- 1 M L | const. à Ÿ°(-1) M; = const. (41) 
fm  N4/ = … Nri 


11 ne reste qu'à déterminer la valeur de la constante dans cette 
formule, 


D — Pour c2lculer cette valeur on peut prendre en considéræ 
tion les séries de figures les plus simples, parce que cette 
constante ne dépend pas, d'après la démonstration donnée, du 
choix de la série, C'est puurquoi considérons les "figures mini— 
males" (les "simplex reguliers de W,1., Stringham®) , figures 
ayant pour l'espace donné, le minimum de sommets, Pour l'espace 
2 N dimensions ce minimum est évidemment égal à N + 1: pour 
déterminer un polygone sur une surface il est nécessaire d'avoir 
trois points ou plus; pour un polyèdre dans l'espace à trois di- 
mensions, 11 est nécessaire d'avoir quatre sommets ou plus, etc. 


Ainsi pour un triangle on 2: 
M=3:M=—3;,M,=1; > M,(-1) —1 (42) 
pour ur tétraëdre: 
i 
M=4;,M=6;M,=4;,M,=1; >) M(-1) —1 (43) 
pour un “pentastère" (-,5-cell" de W.J. Stringham) 
M,=5 ;M,=10; M,—100 ,M,= 5 M, 1; DM, (1) 1 (44) 


Les formes correspondantes sont représentées dans la figure 6 où 
elles sont décomposées pour être représentables dans l'espace à 
N — 1 dimensions, 


En général on a: nombre de lignes (arêtes) égal au nombre 
ù +1 
des combinaisons de (N+1) par deux AC 


nombre de surfaces (faces) égal au nombre des combinaisons de 
(N+1) N (N-1 =C5,,, 
+1 


2 
=C 41° 


{K+1) par trois - 
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nombre de corps (polyèdres) égal au nombre des combinaisons de 
(N+1) par quatre = Cf,,, 


etc.., jusqu'au nombre de i-formes égal au nombre des combinai- 


sons de (N+1) par i+1 = C\ 


ériangle: zh ÀS = VA 
tetraèdre : pA\ \w 4 


Jpentastère ; 


Ë 
& 
NE 
| 


Fig. 6 


Alors on a en général = Ci + Composant les sommes on trouve: 


i N+1 
D rh ne al re pe (45) 
I=0 N 

c'est-à-dire la valeur de la constante cherchée est déterminée: 
elle est égale à 1. Ainsi la formule (34) est établie. 


Cette "méthode combinatoire"{[ou cette "détermination com— 
binatoire"]a été appliquée pour la première fois par B.Kirkmann’ 
mais seulement dans le cas de trois dimensions, — voir awsi W.I. 
Stringham déjà cité. 


La construction de toutes les autres formules de la statis- 
tique de figures à N dimensions revient à la simple énumération 
et à la construction des moyennes dans le sens des formules (3) 
et (15). Ainsi la construction abstraite de la statistique des 
figures étant en principe achevée, considérons qualques exemples 
d'application, 


ll, APPLICATIONS DE LA STATISTIQUE DE POLYGONES 
ET DE POLYÈDRES 


$ 1 —- La statistique de polygones et de polyèdres peut être 
appliquée à des problèmes très différents. Pour donner une idée 
sur le genre de problèmes où cette statistique est applicable, 
mentionnons d'abord un résultat purement négatif, 
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On peut s'attendre à ce que, non seulement les valeurs mo 
yennes des nombres caractéristiques soient liés entre eux, mais 
qu'il en soit de même des distributions des valeurs de ces nom— 
bres parmi les figures d'une série, Cependant une dépendance 
entre les distributions n'existe pas.Pour démontrer cette affir- 
mation purement négative, il suffit de donner des exemples des 
séries de figures ayant la même distribution d'une valeur carac- 
téristique et différentes distributions des autres. Pour simpli- 
fier, donnons un exemple des séries de figures régulières, et 
notamment de polygones, pour faciliter les calculs et les repré- 
sentations graphiques. Deux de telles séries sont représentées 
sur les figures 7 et 8. Au bas des mêmes figures on voit les 
distributions de n et deu: Les distributions de up sont les 
mêmes, tandis que celles de n sont différentes. Etant donné 
que pour le cas de polygones, on n'a que’ deux valeurs caracté- 
ristiques, nous nous persuadons qu'il n'existe aucune liaison 
univoque entre les distributions. Alors, pour le cas de polygo- 
nes, on n'a que les formules 


Rn+ Ru =R2+Rk ,et Rn+Ru = R2+Rk (46) 
déjà citées et des limites 
3€ñ <6; 3<u<6 : 3 €n co ; 3 pu oo (47) 


pour la variation dé la valeur caractéristique. 


Dee 


JANET 
=4 


Me Épeeres Fig. 7 


On obtient facilement le même résultat pour les cas de plu- 
sieurs dimensions. 


Alors on ne peut chercher que des applications où notamment 
les valeurs moyennes sont importantes. On peut classer tous ces 
problèmes d'application parmi deux types. 
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Dans les applications du premier type, la théorie statisti-— 
que développée détermine les limites des domaines où on peut 
exiger les explications physiques, mécaniques,ou autres et ceux, 


n=F°5: 


none: 


W(3)= #2 W(9)= ‘2. 


Fig. 8 


au contraire, où nous n'avons rien que les faits purement mathé-— 
matiques. Le problème de ce genre est, par exemple, le problème 
de sols polygonaux ( voir 8) Vs On a cherché plusieurs fois à ex- 
pliquer le fait de la prédominance de figures à six côtés parmi 
les polygones, formant le réseau des fissures sur un tel sol par 
plusieurs hypothèses: thermique, mécanique et autres. Cependant, 
comme nous le montrons dans la note citée, c'est complètement 
inutile. Du fait que deux fissures ne peuvent s'entrecroiser il 
découle que p = 3. De cela, à son tour, découle que n = 6 et 
tout est, si l'on veut, expliqué. Demander dans ce cas une expli- 
cation physique, c'est, pas plus et pas moins, demander une ex- 
plication physique du fait que dans un triangle la somme des an- 
gles est égale à 180°, Plusieurs applications de la statistique 
de polygones et de polyèdres, aux problèmes de la géomorphologie 
(prismes basaltiques dans les laves © ,® , etc....), astrophysi- 
ue (9 (granulés sur la surface du soleil, etc..), météorologie, 
(9), (nuage, etc...) et plusieurs autres sont encore du même 
genre, Dans la théorie des tourbillons (9),(1), les mêmes consi— 
dérations simples peuvent être appliquées; cependant ici des ap- 
plications plus profondes peuvent aussi avoir lieu. Nous les 
examinerons dans un article spécial, 


$2 —- Une autre classe d'applications de la statistique déve 
loppée est représentée par les applications, où on cherche à dé- 
terminer une série ou, au moins, ces caractéristiques en partant 
des expériences sur une partie de cette série ® , Ici on peut de 


CONSIDÉRATIONS STATISTIQUES SUR LES POLYGONES ET LES POLYÈDRES 195 


nouveau distinguer deux possibilités: 1° déterminer les caracté— 
ristiques statistiques d'un espace à N dimensions, d'après la 
section, c'est-à-dire d'après les données sur l'espace à (N-1) 
dimensions; 2° déterminer les caractéristiques d'une série 
pagpare) par les mesures dans une partie limitée dans cet espace 
déterminer toutes les caractéristiques d'une série ne connais- 
sant que les caractéristiques statistiques). Le premier problème 
est le problème de base de la pétrographie mathématique, où on 
doit déterminer les propriétés d'une série des polyèdres ( des 
cristaux et des espaces entre les cristaux) à partir des mesures 
sur une plaque mince, mesure des polygones, non des polyèdres,. 


Un problème analogue peut être imaginé pour la distribution 
de polygones, 


Fig. 9 


Soit À une distribution de polygones dans un plan euclidien 
(voir fig.9). Cette série de polygones est caractérisée par n et 
mi . Supposons que nous ne connaissions rien sur cette distribu- 
tion, Le problème est donc de déterminer À ou, au moins, n etl 
qui ne nous sont pas connues d'avance. De plus, nos mesures sont 
bornées à ce qu'on peut mesurer sur un segment AB. À l'aide de 
mesures dans cette "section" nous ne connaissons que m , le na-— 
bre des intersections des côtés avec ces segments .Comme dans 
toutes les mesures dans une section, on suppose que la section 
est représentative. La densité des intersections t, qui est 
égale à t = m/AB , peut moyennant que ce segment soit représen- 
tatif, déterminer le nombre de : côtés des polygones se trouvant 
sur l'unité de surface; cette dernière densité est égale à a t’ , 
où à est une constante statistique, C'est tout ce qu'on peut 
obtenir sans hypothèses quantitatives. Ce ne sont pas seulement 
les séries de polygones où nous nous trouvons dans l'impossibi— 
lité de déterminer la série sans des hypothèses supplémentaires; 
c'est également vrai pour toutes les séries de figures à nombre 


pair de dimensions. 
Les hypothèses quantitatives, qu'on peut introduire ici, 


sont très nombreuses. Un exemple simple peut être donné en sup- 
posant que le nombre de polygones sur l'unité de surface est 
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connu; soit o& .« Il est évident que le nombre de côtés de polygo- 
nes sur l'unité de surface peut être exprimé de deux manières: 


76 no? 
en partant du nombre de polygones, il est égal à 2? en partant 


des mesures dans la "section" il est æ& t?. En comparant ces deux 
expressions et en appliquant la formule de base, on a: 


ñ-1afi}, p-1e0ei (48) 


$ 3 — Contrairement aux cas de séries de figures à nombre 
pair de dimensions, ce problème de détermination d'une série en 
partant de la section peut être complètement résolu$) sans hypo- 
thèses quantitatives pour les cas de séries de figures au nombre 
impair de dimensions. Cependant les hypothèses ‘'qualitatives" 
sont nécessaires, pas les hypothèses sur le nombre ("quantités") 
de choses, mais celles sur leurs "relations".Ceci pourrait être, 
en premier lieu, une hypothèse "angulaire" comme la relation 
trigonométrique de notre note 1 - voir ci-dessous. 


Un représentant de séries de figures au nombre impair de di- 
mensions est la série de polyèdres, problème cardinal de la pé- 
trographie mathématique. Avant d'aborder ce problème, soulignons 
qu'il ne s'agit ici que de l'absence des hypothèses quantitati— 
ves — (on ne suppose rien sur la connaissance de telles ou tel-— 
les autres valeurs numériques). Mais nous ne pouvons pas nous 
dispenser d'hypothèses qualitativesset, outre la relation trigo- 
nométrique, des hypothèses que la section et les mesures sur 
elle sont représentatives. Tout ce qui suit est basé sur cette 
“*représentativité" des mesures. On procède en évaluant d'abord 
la valeur Him , R imaginaire des polygones fictifs formés sur le 
plan de notre "section" par les intersections de côtés des poly- 
èdres avec le plan de mesures. Evidemment À = Fimge Alors une des 
caractéristiques est déterminée. Pour les connaître toutes, on 
doit encore tirer des mesures éventuelles la valeur d'une des 
autres caractéristiques. On peut par exemple déterminer à l'aide 
de mesures — €? (densité des côtés de polygones fictifs dont nous 
venons de parler) et s? (densité de ces polygones mêmes). En 
analogie complète avec l'introduction de la constante statisti— 
que & (voir le paragraphe précédent), on peut introduire les 
constantes statistiques fi, et GB; qui nous permettent d'imaginer f0” 
(densité de faces de polyèdres) et [52 (densité de polpèdres 
mêmes). Etant donné que la première grandeur peut être aussi re 


présentée par _ Prs? , On a! 
2 
Bo! LÆ 2 
. —B,0t; et Fi , (49) 
B2\s 


ce qui nous détermine f. Les grandeurs À et f connues, on cal— 
cule les autres caractéristiques à l'aide des équations données 


plus haut et 
ces F = sin Éfs (50) 
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ce qui exprime “l'hypothèse qualitative" mentionnée au commen 


cement du paragraphe. La relation (50) n'est exacte que pour les 
polyèdres réguliers. Elle peut être acceptée pour les polyèdres 
de tous types considérés en moyenne. En introduisant on commet 
une erreur d'ailleurs pas très grande si l'on ne considère pas 
les polyèdres très aplatis ou très allongés. Nous nous occupons 
de l'estimation de cette erreur, ainsi que d'autres formes éven-— 
tuelles d'hypothèses quantitatives en autre endroit. Ici nous 
n'avons indiqué que le schéma général ; cependant ce calcul donne 
une idée des applications de la statistique développée aux pro= 
blèmes de "sections", 


$ 4 — Il nous reste encore à faire un court exposé sur les a- 
plications de la statistique de figures aux problèmes de La dé— 
termination d'une série (espace) en partant des mesures sur une 
de ses parties, partie R cependant le même nombre de dimen— 
sions que la série même Ü) , Ici, il existe de même comme on l'a 
déjà souligné deux fois ci-dessus à l'occasion d'autres problè- 
mes, une différence essentielle entre les séries de figures a 
nombres pair et impairs de dimensions, 


Commençons par le cas des polygones. Considérons une série 
très grande de polygones; supposons qu'une partie de cette série 
est représentative, et mesurons (ou, pour mieux dire, comptons), 
n et dans cette partie. L'hypothèse de la "représentativité" 
équivaut à admettre que les valeurs de n,u de cette partie 
sont les mêmes que celles de n,lUi pour toute la série, Ainsi en 
appliquant la formule (5), on calcule k , nombre de côtés dans 
toute la série caractéristique de la série entière. Connaissant 
k , on obtient facilement e, f, etc.. On voit que les mesures 
sur la partie représentativé nous donnent des indications sur le 
““yolume" du "monde". Pour les polygones sur un plan euclidien,la 


valeur de l'expression: + SEL'est égale à 5 3 c'est un "monde" 


H 


infini et plan. La valeur numérique Z joue ici le même rôle que 


la valeur numérique JT dans la géométrie usuelle. Si la valeur 


+++ diffère dense ceci indique que le "monde" n'est pas plan, 


ur 2 


circonférence 
en analogie avec le cas où le rapport 7 — 


diffère de 
2 (rayon) 
TI. Au contraire, si on suppose que le plan est vraiment "plan", 
les mesures de n,{ nous amène à calculer la valeur de 2, en 
analogie complète avec le procédé par lequel on calcule T en 
jetant l'aiguille sur un cercle dessiné. Alors les mesures de x, 
U sont équivalentes dans un certain sens aux mesures de la 
courbure. 


En opposition avec tout cela, on ne peut rien obtenir à 
l'aide de telles mesures dans une partie de la série de polyè— 
dres, même si cette partie est représentative. Ici, comme il 
s'ensuit de (20), ce ne sont que les valeurs relatives de E, F, 
K, M qui entrent dans les formules déterminant les grandeurs 
statistiques, 
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Deux hypothèses peuvent être énoncées: 


Soit I : que la courbure de la série ("monde") de figures 
à nombre impair de dimensions n'est pas mesurable à partir des 
grandeurs statistiques. 


Nous reviendrons à cette possibilité dans le 66. 


Soit II : que, à la courbure donnée ne correspond aucune 
valeur déterminée du volume du "monde", 


$5 — Cette dernière hypothèse s'accorde très bien avec le 
fait évident que dans les espaces pairs on peut imaginer l'in— 
finité des figures régulières, tandis que les espaces impairs 
n'ont qu'un nombre fini de telles figures. 


Imaginons par exemple que nous sommes sur la surface d'un 
polyèdre et que nous tentons de déterminer ce polyèdre à partir 
de mesures locales, Supposons pour fixer l'idée que les mesures 
dans un domaine représentatif nous ont donné: HUE Alors, 
composant l'expression déterminant la courbure: 1/n + 1/f - 1/2, 
on obtient: 1/u + 1/ñ - 1/2 = 1/6, C'est-h-dire que notre polyè- 
dre à 6 arêtes et par conséquent 4 faces: c'est un tétraèdre, 
sans aucun doute possible. 


Au contraire, imaginons maintenant que nous sommes "sur" ou 
"dans" le volume d'un polystèré (polytope de 4 dimensions). Nous 
mesurons: 


_a) toutes les grandeurs déterminant statistiquement une cellule, 
un élément: nn, , €, k, f (qui équivalent à la grandeur n dé- 
terminant statistiquement la cellule, l'élément dans le cas d’un 


polyèdre); et, 


b) toutes les grandeurs déterminant statistiquement le point de 
la conjonction des cellules, des éléments: À ,U > His His Ps (qui 
équivalent à la grandeur U déterminant statistiquement le point 
de la conjonction des cellules des éléments dans le cas d'un po- 
lyèdre). Supposons que nous avons trouvé: n=3,H=3, €=4, k=6% 
f=4,7 =3,0-4,n-6,-4,. Cependant, à partir de formules énumérati-— 
yves données dans II $2 et II $3, il est impossible de calcu- 
ler M, E, K, F; on n'obtient que: E/M = 1; K/M = F/M = 2. On 
sait que "5-cell" de Si totem (EN a exactement les valeurs des 
rapports indiqués entre E, M, F, K. On peut par conséquent sup- 
poser, sans introduire de contradictions, que E=M=5, K=F=10 et 
que nous sommes "dans" ou "sur" un pentastère -,5-cell". Mais 
avec les mêmes raisons on peut supposer que la figure (le polys- 
tère) a E=M=5& et K=F=-10w où « est un nombre entier (ou même 
non-entier) arbitraire. 


Tout cela est vrai si on ne dispose que des relations énu- 
mératives mentionnées, Le seul procédé à partir duquel on peut 
déterminer univoquement les nombres caractéristiques d'un polys- 
tère, est l'introduction plus ou moins arbitraire d'une relation 
du type (50), basée sur les raisons de "l'évidence géométrique", 
En opérant avec cette "évidence" (qui, en cas de 4 (et plus) di- 
mensions est plus qu'arbitraire) on peut éliminer l'infinité de 
solutions des équations (20) et (31) homogènes en M, E, F, K, et 
parvenir dans chaque cas concret à une solutian unique. Ainsi,on 
trouve,pour le cas de 4 dimensions, 6 polystères de Stringham,. 
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Mais, nous soulignons ce fait, cette détermination univoque, 
dans les cas de 20 dimensions, ne découle pas des relations énu- 
mératives; tandis qu'en cas de 2V +1 dimensions toutes les gran— 
deurs sont déterminables à partir de ces relations énumératives 
ici développées, 


On peut avoir des opinions diamétralement opposées .sur 
notre droit d'introduire, ou de non-introduire, les généralisa- 
tions des relations non énumératives; par exemple les relations 
“angulaires" du type de (50). Toutefois, un fait reste toujours 
le même: cette généralisation de (50) (- ou d'autres relations 
“angulaires" non énumératiyves) est nécessaire dans les cas V 
pair et pas nécessaire dans les cas V impair, 


$6 — Reprenons maintenant l'hypothèse I(voir la fin du $4),. 
On peut trouver à cette hypothèse plusieurs formes, formes nom- 
breuses et très différentes. La plus naturelle est la suivante. 
Elle se base sur les raisons qui sont indiquées dans le paragra- 
phe précédent comme appartenant à "l'évidence géométrique". 


Il est "évident" que,dans une série de polyèdres dans un 
espace à trois dimensions, espace euclidien ou courbé, il ne se 
produit pas de changements des valeurs moyennes des angles au- 
près des sommets et auprès des arêtes, si l'on conserve les va- 
leurs des grandeurs caractéristiques: ,n , À He KT, Ha » Ha 
b, et,si l'on ne change que les longueurs relatives des arêtes: 
Cependant une affirmation réciproque n'est pas valable, Pour 
établir l'impossibilité de cette affirmation réciproque il suf- 
fit d'un exemple 


La série des octàèdres réguliers, où chaque arête appar- 
tient aux quatre polyèdres (A=4), est formée par 24 octaèdres 
c'est un "24-cell" de Stringham® construit en partant de "l'évi- 
dence géométrique", Si chaque arête n'appartient pas aux quatre 
mais à un nombre plus petit de polyèdres (À=3 ou entre 3 et 4), 
le nombre des octaèdres réguliers dans le "monde" serait encore 
plus petit: M<24. Ceci pourrait être illustré par les tétraè- 
dres qui, touchant les arêtes au nombre de trois (\=3), forment 
un "monde" de 5 figures ("5-cell"de Stringham) et qui, touchant 
ces arêtes au nombre quatre (A=4), forment un "monde" de 16 fi— 
gures ("16-cell"). Alors le "monde" pour les octaèdres réguliers 
touchant entre eux au nombre moins de quatre (A<4) contient 


moins de 24 figures. 


Considérons maintenant les octaèdres non-réguliers dont 
chacun est formé par les parties des deux cubes joints par la 
face ABCD. Soient O et 0' les centres de ces cubes. L'octaèdre 
considéré est OABCDO' , IL est évident que le ‘“monde" formé par 
ces polyèdres, est infini (M-æ). Pour les arêtes AB, BC, CD et 
DA le nombre À est égal à 4; pour les autres arêtes il est égal 
à trois. On voit que la valeur moyenne de À se trouve entre 3 et 
ARON CAS 


Alors deux séries des polyèdres sont construites,- séries 
ayant les mêmes valeurs des paramètres caractéristiques: pu CITES 
À; ©» K, fus Mis Ms — l'une,des polyèdres réguliers, l'autre 
des polyèdres non-réguliers (OABCDO), Pour la première série 
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M<24, tandis que pour la deuxième M=@ ; les grandeurs E, K,; F, 
diffèrent pour ces deux séries dans la même proportion. Alors, 
dans le cas de l'espace au nombre impair de dimensions,la cons- 
tance des grandeurs non-statistiques M, etc. détermine la con- 
servation des grandeurs statistiques (voir ci-dessus) même si 
l’on change les longueurs des arêtes, Au contraire, ces gran- 
deurs statistiques laissent libre le choix des grandeurs non- 
statistiques. 


Rien de pareil n'existe dans les espaces au nombre pair de 
dimensions. Par exemple pour le cas d'un plan, le nombre f de 
polygones dans le "monde" est complètement déterminé par les 
nombres caractéristiques n et LU . D'aucune manière il ne dépend 
des longueurs de côtés des polygones formant la série. La même 
chose est vraie pour les séries des "5", "6",,..."Q-ce1l” dans 
l'espace à quatre dimensions, etc... 


Tout cela est étroitement lié avec la forme que prend la 
formule (34) dans les cas de N pair ou impair? , Pour N 
augmentant, cette formule prend alternativement la forme avec un 
terme constant ou sans ce terme; alternativement cette formule 
contient, soit les valeurs absolues de Mi, soit leurs valeurs 
relatives. 


Ces résultats (? peuvent être définitivement formulés sous 
la forme suivante: en partant de grandeurs statistiques, les 
grandeurs M sont déterminables dans les espaces à nombre pair de 
dimensions et indéterminables dans les espaces à nombre impair 
de dimensions. C'est pourquoi il convient de distinguer: 


a) Les espaces statistiquement indéterminables, au sens géomé- 
trique les espaces "non-propres", "hypersurfaces'"; et 


b) Les espaces déterminables, au sens géométrique "propres". 
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